内容简介 · · · · · ·
本书从强化学习最基本的概念开始介绍,将介绍基础的分析工具,包括贝尔曼方程和贝尔曼最优方程,然后推广到基于模型的和无模型的强化学习算法,最后推广到基于值函数和策略函数的强化学习方法。本书强调从数学的角度引入概念、分析问题、分析算法。本书不要求读者具备任何关于强化学习的知识背景,仅要求读者具备一定的概率论和线性代数的知识。如果读者已经具备强化学习的学习基础,本书可以帮助读者更深入地理解一些问题并提供新的视角。
本书面向对强化学习感兴趣的本科生、研究生、研究人员和企业或研究所的从业者。
作者简介 · · · · · ·
赵世钰 西湖大学工学院人工智能系特聘研究员,智能无人系统实验室负责人,国家海外高层次人才引进计划青年项目获得者;本硕士毕业于北京航空航天大学,博士毕业于新加坡国立大学,曾任英国谢菲尔德大学自动控制与系统工程系Lecturer;致力于研发有趣、有用、有挑战性的下一代机器人系统,重点关注多机器人系统中的控制、决策与感知等问题。
豆瓣成员常用的标签 · · · · · ·
喜欢读"强化学习的数学原理"的人也喜欢 · · · · · ·
强化学习的数学原理的书评 · · · · · · ( 全部 8 条 )
你的第一本RL教科书
这本书,这门课是我的RL引路人,由浅入深,从Model-Base到Model-Free,从Value Function Approximation到Policy Function Approximation再到AC,覆盖了RL的主要内容。虽然这本书侧重于数学原理,离实践还有一定距离,但理解了这套框架,抓住RL的本质,后续理解RL中的一些具体算...
(展开)
如果你觉得好,那一定是有原因的
从最开始 Overview 的图就能感觉到作者一定是下了功夫的。很多平庸的书,编排逻辑混乱,只是堆砌内容,完全没有理清各章之间的联系,应该先写什么后写什么。书的结构编排对于初学者而言,是非常重要的,这也是为什么很多同学觉得英文教材一般都比中文教材讲得好,因为作者的用...
(展开)
不可多得的好教材,强烈推荐!!!
很久之前我便在github上收藏过这本书,本书深入浅出的讲解让强化学习晦涩难懂的知识点以及公式推导等深入浅出,清晰明了。我一直在用这本电子版教材自学强化学习的相关知识,这本书可以说是我的强化学习启蒙课!之后有同学告诉我这本教材在B站推出了对应的视频课程,我如获至宝...
(展开)
不可多得的好教材,强烈推荐!!!
很久之前我便在github上收藏过这本书,本书深入浅出的讲解让强化学习晦涩难懂的知识点以及公式推导等深入浅出,清晰明了。我一直在用这本电子版教材自学强化学习的相关知识,这本书可以说是我的强化学习启蒙课!之后有同学告诉我这本教材在B站推出了对应的视频课程,我如获至宝...
(展开)
当AI浪潮席卷而来,这本书让我看懂了算法背后的数学之美
一个让我放下偏见的意外 说实话,这些年我几乎不碰中文技术书。不是崇洋媚外,而是太多教材的创作动机不是教育,而是考核——这是一位读者在豆瓣短评里的原话,也道出了无数人的心声。但《强化学习的数学原理(英文版)》打破了我的刻板印象。 当我在B站刷到赵世钰老师的课程时...
(展开)
非常酷的一本书!初学者和老手都适合看一看!
非常好的一本书,之前通过朋友了解到赵老师的这门课,赵老师的课程免费的电子书以及非常好的视频。特别是这个视频,我能深刻感受到赵老师是录了很多遍,精益求精,如此好书我一直期待着它的出版!最近终于出版了也成功上手!!!已经给我周围同学疯狂安利了。我觉得对于已经入...
(展开)
> 更多书评 8篇
论坛 · · · · · ·
在这本书的论坛里发言这本书的其他版本 · · · · · · ( 全部2 )
-
清华大学出版社 (2024)9.7分 26人读过
以下书单推荐 · · · · · · ( 全部 )
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有695人想读,手里有一本闲着?
订阅关于强化学习的数学原理的评论:
feed: rss 2.0










6 有用 C. 2025-07-16 10:10:20 浙江
堪称经典!或许可以加两章 —— 毕竟课程结束的DDPG 之后,TRPO/PPO/TD3/SAC 在策略梯度框架里进化显著,优化目标、约束机制以及实现方式上差异不小,DPO/GRPO 更是跳脱了贝尔曼方程和价值迭代,这些内容最近自学起来还是挺吃力的。
0 有用 辰爵 2025-05-22 10:49:10 江苏
对理解强化学习的原理很有用,理清了很多概念,之后看其他前沿RL论文也会清晰很多,可惜只写到A2C,更前沿的论文还需要自己额外补充数学知识
0 有用 必去313 2025-06-11 14:54:52 辽宁
依稀记得从2022年9月接触到赵老师的同名课程,在做课题组的任务之外一直学习着这门课,反反复复地看不知看了几遍,电子书也打印出来仔细学习公式推导,看着播放量从3万涨到8万,老师的教学无疑是得到了大家的认可。
2 有用 豆友yOuvEgL1Sw 2025-06-09 19:07:59 浙江
看了网上其他好多资料,对rl介绍知识很散,我是通过看这本书才真正梳理清楚了强化学习的脉络,在我看来这本书是神一般的存在。
0 有用 Leakingpipe 2025-09-02 11:40:20 重庆
配合老师的视频课程看,非常清晰。