豆瓣
扫码直接下载
数学基础的需求已经尽量浅显,细致,有条理
有主线有脉络,写得很清楚,每章的符号比较统一,附录部分的数学内容详略得当。
首先我的强化学习就是以这本书入的门.这本书从数学原理出发,深层的解释了强化学习.对初学者很友好,章节清晰,每个章节衔接没有突兀.对于想深入强化学习的读者来说,也很适合,其中给出了很多算法的推导,包括bellman公式的迭代收敛证明,最优bellman的求解证明,使用RM视角解释mc、TD、q-learning算法,以及随机策略梯度和确定性策略梯度的证明.看这本书的同时,再同步赵老师的视频,效果更好. 有个个人小建议: 书上加上回溯图,会更加生动具体.
> 强化学习的数学原理(英文版)
0 有用 叶小钗 2024-09-19 16:21:22 北京
数学基础的需求已经尽量浅显,细致,有条理
0 有用 咋回事啊? 2025-03-24 15:11:03 上海
有主线有脉络,写得很清楚,每章的符号比较统一,附录部分的数学内容详略得当。
0 有用 任杰 2024-09-13 10:58:52 北京
首先我的强化学习就是以这本书入的门.这本书从数学原理出发,深层的解释了强化学习.对初学者很友好,章节清晰,每个章节衔接没有突兀.对于想深入强化学习的读者来说,也很适合,其中给出了很多算法的推导,包括bellman公式的迭代收敛证明,最优bellman的求解证明,使用RM视角解释mc、TD、q-learning算法,以及随机策略梯度和确定性策略梯度的证明.看这本书的同时,再同步赵老师的视频,效果更好. 有个个人小建议: 书上加上回溯图,会更加生动具体.