머신러닝스터디/2017: Difference between revisions

From ZeroWiki

Revision as of 07:08, 22 July 2017

CNN, Artistic style
Reinforcement learning, game play

Reinforcement Learning

Monte-Carlo Reinforcement Learning

직접적인 경험으로부터 배움
Model-free : 직접적인 MDP transition과 보상을 알 필요가 없다
끝난 에피소드로부터 학습한다.
episodic MDP 문제만 풀 수 있다.

Temporal-Difference Learning

Retrieved from "https://mediawiki.zeropage.org/index.php?title=머신러닝스터디/2017&oldid=50390"