强化学习基础¶
约 103 个字 预计阅读时间不到 1 分钟
「大二春夏」
这里的笔记来自于两部分:第一个是 David Silver 在 UCL 的强化学习课程,第二个是 Richard Sutton 和 Andrew Barto 合著的 Reinforcement Learning: An Introduction。
Table of Contents¶
- Course: Lecture 1
- Sutton & Barto: Chapter 1 Introduction
- Sutton & Barto: Chapter 2 Multi-armed Bandits
- Sutton & Barto: Chapter 3 Finite Markov Decision Processes
- Sutton & Barto: Chapter 4 Dynamic Programming
- Sutton & Barto: Chapter 5 Monte Carlo Methods
- Sutton & Barto: Chapter 6 Temporal-Difference Learning
- Sutton & Barto: Chapter 7 n-step Bootstrapping