머신러닝스터디/2017/Reinforcement Learning/: Difference between revisions

Revision as of 06:51, 5 August 2017

@@ Line 6: / Line 6: @@
 * Sarsa
 ** on policy
+** Sarsa는 다음과 같은 조건에서 converge한다
+## GLIE sequence of policies
+## Robinson Monro sequence of step sizes