More actions
No edit summary |
No edit summary |
||
| Line 5: | Line 5: | ||
==== Monte-Carlo Reinforcement Learning ==== | ==== Monte-Carlo Reinforcement Learning ==== | ||
* 직접적인 경험으로부터 배움 | |||
* Model-free : 직접적인 MDP transition과 보상을 알 필요가 없다 | |||
* 끝난 에피소드로부터 학습한다. | |||
* episodic MDP 문제만 풀 수 있다. | |||
==== Temporal-Difference Learning ==== | ==== Temporal-Difference Learning ==== | ||
Revision as of 07:08, 22 July 2017
- CNN, Artistic style
- Reinforcement learning, game play
Reinforcement Learning
Monte-Carlo Reinforcement Learning
- 직접적인 경험으로부터 배움
- Model-free : 직접적인 MDP transition과 보상을 알 필요가 없다
- 끝난 에피소드로부터 학습한다.
- episodic MDP 문제만 풀 수 있다.