[퀀트] Making Quant System 4
안녕하세요~ 이번 퀀트모임에서는 강화학습 알고리즘들을 연구하고 선물데이터를 사용해서 학습을 시켜볼 수 있도록 Gym 환경을 기반으로 커스텀한 환경을 생성하였습니다. 이를
안녕하세요~ 이번 퀀트모임에서는 강화학습 알고리즘들을 연구하고 선물데이터를 사용해서 학습을 시켜볼 수 있도록 Gym 환경을 기반으로 커스텀한 환경을 생성하였습니다. 이를
안녕하세요~ 퀀트 모임에서 진행하고 있는 강화학습을 이용한 머신트레이딩 만들기 내용을 공유하는 세번째입니다. 지금까지 살펴보고 정리된 자료는 아래 링크에서 보실
안녕하세요. 이번주 중반까지는 계속 죽을 쓰다가 후반에 다시 힘을 내어 수익으로 돌아서는 결과가 보여졌습니다. 중간에 하루,이틀 오류가 생기면서 못돌리기도
1 step TD의 step을 증가시켜 나가면서 n 까지 보게 되면 n step TD로 일반화를 할 수 있습니다. 만약 step이 무한대에 가깝게 되면 MC와 동일하게 될…
TD 방식도 마찬가지로 직접적인 경험을 하면서 학습을 하는 알고리즘입니다.DP에서 사용하던 bootstrapping을 사용하고 MD에서 사용하던 Model-free 방식의 장점을 두루 갖추고 있는 것이 특징입니다.every-visit MC에서는 실제 에피소드가…
1. IntroduceDynamic 이라는 것은 연속적으로 발생되는 문제들을 푸는 것을 말하고, Programming 은 개발언어가 아니라 수학적인 문제를 의미합니다. Dynamic Programming 이라는 것은 이렇게 연속적으로 스탭 바이 스탭으로…