强化学习基础¶ 约 96 个字 预计阅读时间不到 1 分钟 「大二春夏」 这里的笔记来自于两部分:第一个是 David Silver 在 UCL 的强化学习课程,第二个是 Richard Sutton 和 Andrew Barto 合著的 Reinforcement Learning: An Introduction。 Table of Contents¶ Course: Lecture 1 Book: Chapter 1 Introduction Book: Chapter 2 Multi-armed Bandits Book: Chapter 3 Finite Markov Decision Processes Book: Chapter 4 Dynamic Programming Book: Chapter 5 Monte Carlo Methods Book: Chapter 6 Temporal-Difference Learning Book: Chapter 7 n-step Bootstrapping