作者:
[法] 奥雷利安·杰龙(Aurélien Géron)
出版社: 机械工业出版社
副标题: 基于Scikit-Learn、Keras和TensorFlow
原作名: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems
译者: 宋能辉 / 李娴
出版年: 2024-6
页数: 724
装帧: 平装
ISBN: 9787111749714
出版社: 机械工业出版社
副标题: 基于Scikit-Learn、Keras和TensorFlow
原作名: Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems
译者: 宋能辉 / 李娴
出版年: 2024-6
页数: 724
装帧: 平装
ISBN: 9787111749714
内容简介 · · · · · ·
本书分为两大部分:di一部分主要基于Scikit-Learn,介绍机器学习的基础算法;第二部分则使用TensorFlow和Keras,介绍神经网络与深度学习。此外,附录部分的内容也非常丰富,包括课后练习题解答、机器学习项目清单、SVM对偶问题、自动微分和特殊数据结构等。书中内容广博,覆盖了机器学习的各个领域,不仅介绍了传统的机器学习模型,包括支持向量机、决策树、随机森林和集成方法,还提供了使用Scikit-Learn进行机器学习的端到端训练示例。作者尤其对深度神经网络进行了深入的探讨,包括各种神经网络架构、强化学习,以及如何使用TensorFlow/Keras库来构建和训练神经网络。本书兼顾理论与实战,既适合在校学生,又适合有经验的工程师。
机器学习实战(原书第3版)的创作者
· · · · · ·
-
奥雷利安·杰龙 作者
作者简介 · · · · · ·
Aurélien Géron是机器学习方面的顾问。他曾就职于Google,在2013年到2016年领导过YouTube视频分类团队。他是Wifirst公司(法国领先的无线互联网服务供应商)的创始人,并于2002年至2012年担任该公司的首席技术官。2001年,他创办Ployconseil公司(一家电信咨询公司),并任首席技术官。
目录 · · · · · ·
目录
前言1
**部分 机器学习的基础知识11
第1章 机器学习概览13
1.1 什么是机器学习14
1.2 为什么使用机器学习14
1.3 应用示例17
1.4 机器学习系统的类型18
1.5 机器学习的主要挑战33
1.6 测试和验证39
1.7 练习题43
第2章 端到端机器学习项目44
2.1 使用真实数据44
2.2 放眼大局46
2.3 获取数据50
2.4 探索和可视化数据以获得见解63
2.5 为机器学习算法准备数据69
2.6 选择和训练模型87
2.7 微调模型91
2.8 启动、监控和维护系统96
2.9 试试看99
2.10 练习题99
第3章 分类101
3.1 MNIST101
3.2 训练二元分类器104
3.3 性能测量104
3.4 多类分类115
3.5 错误分析118
3.6 多标签分类121
3.7 多输出分类123
3.8 练习题124
第4章 训练模型126
4.1 线性回归127
4.2 梯度下降132
4.3 多项式回归141
4.4 学习曲线143
4.5 正则化线性模型146
4.6 逻辑回归153
4.7 练习题162
第5章 支持向量机164
5.1 线性SVM分类164
5.2 非线性SVM分类167
5.3 SVM回归172
5.4 线性SVM分类器的工作原理174
5.5 对偶问题176
5.6 练习题180
第6章 决策树181
6.1 训练和可视化决策树181
6.2 做出预测182
6.3 估计类概率185
6.4 CART训练算法185
6.5 计算复杂度186
6.6 基尼杂质或熵186
6.7 正则化超参数187
6.8 回归189
6.9 对轴方向的敏感性191
6.10 决策树具有高方差192
6.11 练习题193
第7章 集成学习和随机森林194
7.1 投票分类器194
7.2 bagging和pasting198
7.3 随机森林202
7.4 提升法204
7.5 堆叠法212
7.6 练习题215
第8章 降维216
8.1 维度的诅咒217
8.2 降维的主要方法218
8.3 PCA221
8.4 随机投影228
8.5 LLE230
8.6 其他降维技术232
8.7 练习题234
第9章 无监督学习技术235
9.1 聚类算法:k均值和DBSCAN236
9.2 高斯混合模型256
9.3 练习题265
第二部分 神经网络与深度学习267
第10章 Keras人工神经网络简介269
10.1 从生物神经元到人工神经元270
10.2 使用Keras实现MLP284
10.3 微调神经网络超参数308
10.4 练习题316
第11章 训练深度神经网络319
11.1 梯度消失和梯度爆炸问题319
11.2 重用预训练层333
11.3 更快的优化器338
11.4 学习率调度346
11.5 通过正则化避免过拟合350
11.6 总结和实用指南357
11.7 练习题358
第12章 使用TensorFlow自定义模型和训练360
12.1 TensorFlow快速浏览360
12.2 像使用NumPy一样使用TensorFlow363
12.3 自定义模型和训练算法368
12.4 TensorFlow函数和图387
12.5 练习题392
第13章 使用TensorFlow加载和预处理数据394
13.1 tf.data API395
13.2 TFRecord格式405
13.3 Keras预处理层411
13.4 TensorFlow数据集项目425
13.5 练习题427
第14章 使用卷积神经网络进行深度计算机视觉429
14.1 视觉皮层的结构429
14.2 卷积层431
14.3 池化层439
14.4 使用Keras实现池化层441
14.5 CNN架构443
14.6 使用Keras实现ResNet-34 CNN460
14.7 使用Keras的预训练模型462
14.8 使用预训练模型进行迁移学习463
14.9 分类和定位466
14.10 物体检测467
14.11 物体跟踪474
14.12 语义分割475
14.13 练习题478
第15章 使用RNN和CNN处理序列480
15.1 循环神经元和层481
15.2 训练RNN484
15.3 预测时间序列485
15.4 处理长序列505
15.5 练习题515
第16章 基于RNN和注意力机制的自然语言处理516
16.1 使用字符RNN生成莎士比亚文本517
16.2 情感分析525
16.3 用于神经机器翻译的编码器-解码器网络532
16.4 注意力机制541
16.5 Transformer模型的雪崩554
16.6 视觉Transformer558
16.7 Hugging Face的Transformer库562
16.8 练习题566
第17章 自动编码器、GAN和扩散模型568
17.1 有效的数据表示569
17.2 使用不完备的线性自动编码器执行PCA571
17.3 堆叠式自动编码器572
17.4 卷积自动编码器579
17.5 去噪自动编码器580
17.6 稀疏自动编码器582
17.7 变分自动编码器584
17.8 生成Fashion MNIST图像588
17.9 生成对抗网络589
17.10 扩散模型602
17.11 练习题608
第18章 强化学习610
18.1 学习优化奖励611
18.2 策略搜索612
18.3 OpenAI Gym介绍614
18.4 神经网络策略617
18.5 评估动作:信用分配问题619
18.6 策略梯度620
18.7 马尔可夫决策过程624
18.8 时序差分学习628
18.9 Q学习629
18.10 实现深度Q学习632
18.11 深度Q学习的变体636
18.12 一些流行的RL算法概述640
18.13 练习题643
第19章 大规模训练和部署TensorFlow模型645
19.1 为TensorFlow模型提供服务646
19.2 将模型部署到移动设备或嵌入式设备664
19.3 在Web页面中运行模型666
19.4 使用GPU加速计算668
19.5 跨多个设备训练模型676
19.6 练习题694
致读者694
附录A 机器学习项目清单697
附录B 自动微分703
附录C 特殊数据结构710
附录D TensorFlow图716
· · · · · · (收起)
前言1
**部分 机器学习的基础知识11
第1章 机器学习概览13
1.1 什么是机器学习14
1.2 为什么使用机器学习14
1.3 应用示例17
1.4 机器学习系统的类型18
1.5 机器学习的主要挑战33
1.6 测试和验证39
1.7 练习题43
第2章 端到端机器学习项目44
2.1 使用真实数据44
2.2 放眼大局46
2.3 获取数据50
2.4 探索和可视化数据以获得见解63
2.5 为机器学习算法准备数据69
2.6 选择和训练模型87
2.7 微调模型91
2.8 启动、监控和维护系统96
2.9 试试看99
2.10 练习题99
第3章 分类101
3.1 MNIST101
3.2 训练二元分类器104
3.3 性能测量104
3.4 多类分类115
3.5 错误分析118
3.6 多标签分类121
3.7 多输出分类123
3.8 练习题124
第4章 训练模型126
4.1 线性回归127
4.2 梯度下降132
4.3 多项式回归141
4.4 学习曲线143
4.5 正则化线性模型146
4.6 逻辑回归153
4.7 练习题162
第5章 支持向量机164
5.1 线性SVM分类164
5.2 非线性SVM分类167
5.3 SVM回归172
5.4 线性SVM分类器的工作原理174
5.5 对偶问题176
5.6 练习题180
第6章 决策树181
6.1 训练和可视化决策树181
6.2 做出预测182
6.3 估计类概率185
6.4 CART训练算法185
6.5 计算复杂度186
6.6 基尼杂质或熵186
6.7 正则化超参数187
6.8 回归189
6.9 对轴方向的敏感性191
6.10 决策树具有高方差192
6.11 练习题193
第7章 集成学习和随机森林194
7.1 投票分类器194
7.2 bagging和pasting198
7.3 随机森林202
7.4 提升法204
7.5 堆叠法212
7.6 练习题215
第8章 降维216
8.1 维度的诅咒217
8.2 降维的主要方法218
8.3 PCA221
8.4 随机投影228
8.5 LLE230
8.6 其他降维技术232
8.7 练习题234
第9章 无监督学习技术235
9.1 聚类算法:k均值和DBSCAN236
9.2 高斯混合模型256
9.3 练习题265
第二部分 神经网络与深度学习267
第10章 Keras人工神经网络简介269
10.1 从生物神经元到人工神经元270
10.2 使用Keras实现MLP284
10.3 微调神经网络超参数308
10.4 练习题316
第11章 训练深度神经网络319
11.1 梯度消失和梯度爆炸问题319
11.2 重用预训练层333
11.3 更快的优化器338
11.4 学习率调度346
11.5 通过正则化避免过拟合350
11.6 总结和实用指南357
11.7 练习题358
第12章 使用TensorFlow自定义模型和训练360
12.1 TensorFlow快速浏览360
12.2 像使用NumPy一样使用TensorFlow363
12.3 自定义模型和训练算法368
12.4 TensorFlow函数和图387
12.5 练习题392
第13章 使用TensorFlow加载和预处理数据394
13.1 tf.data API395
13.2 TFRecord格式405
13.3 Keras预处理层411
13.4 TensorFlow数据集项目425
13.5 练习题427
第14章 使用卷积神经网络进行深度计算机视觉429
14.1 视觉皮层的结构429
14.2 卷积层431
14.3 池化层439
14.4 使用Keras实现池化层441
14.5 CNN架构443
14.6 使用Keras实现ResNet-34 CNN460
14.7 使用Keras的预训练模型462
14.8 使用预训练模型进行迁移学习463
14.9 分类和定位466
14.10 物体检测467
14.11 物体跟踪474
14.12 语义分割475
14.13 练习题478
第15章 使用RNN和CNN处理序列480
15.1 循环神经元和层481
15.2 训练RNN484
15.3 预测时间序列485
15.4 处理长序列505
15.5 练习题515
第16章 基于RNN和注意力机制的自然语言处理516
16.1 使用字符RNN生成莎士比亚文本517
16.2 情感分析525
16.3 用于神经机器翻译的编码器-解码器网络532
16.4 注意力机制541
16.5 Transformer模型的雪崩554
16.6 视觉Transformer558
16.7 Hugging Face的Transformer库562
16.8 练习题566
第17章 自动编码器、GAN和扩散模型568
17.1 有效的数据表示569
17.2 使用不完备的线性自动编码器执行PCA571
17.3 堆叠式自动编码器572
17.4 卷积自动编码器579
17.5 去噪自动编码器580
17.6 稀疏自动编码器582
17.7 变分自动编码器584
17.8 生成Fashion MNIST图像588
17.9 生成对抗网络589
17.10 扩散模型602
17.11 练习题608
第18章 强化学习610
18.1 学习优化奖励611
18.2 策略搜索612
18.3 OpenAI Gym介绍614
18.4 神经网络策略617
18.5 评估动作:信用分配问题619
18.6 策略梯度620
18.7 马尔可夫决策过程624
18.8 时序差分学习628
18.9 Q学习629
18.10 实现深度Q学习632
18.11 深度Q学习的变体636
18.12 一些流行的RL算法概述640
18.13 练习题643
第19章 大规模训练和部署TensorFlow模型645
19.1 为TensorFlow模型提供服务646
19.2 将模型部署到移动设备或嵌入式设备664
19.3 在Web页面中运行模型666
19.4 使用GPU加速计算668
19.5 跨多个设备训练模型676
19.6 练习题694
致读者694
附录A 机器学习项目清单697
附录B 自动微分703
附录C 特殊数据结构710
附录D TensorFlow图716
· · · · · · (收起)
喜欢读"机器学习实战(原书第3版)"的人也喜欢的电子书 · · · · · ·
支持 Web、iPhone、iPad、Android 阅读器
喜欢读"机器学习实战(原书第3版)"的人也喜欢 · · · · · ·
机器学习实战(原书第3版)的书评 · · · · · · ( 全部 14 条 )
书写的很好,有些地方英文版是对的,但是中文版就莫名其妙的是错的
这篇书评可能有关键情节透露
书写的很好,很实用。但是有些地方英文版是对的,但是中文版就莫名其妙的是错的。 中文版: 英文版: 具体错误请看图。-------- 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁 字数补丁... (展开)实战性拉满的机器学习蜥蜴书,真香!
被种草许久、广受赞誉的机器学习蜥蜴书——来自业界大佬 Aurélien Géron 编著的 Hands-On Machine Learning 实用指南,读过了才知道是真的香。 利用寒假的闲余,读完了上册,内容主要是基于 Scikit-Learn 库来实现的统计学习算法。尽管暂时还没有开启讲神经网络/深度学习的下...
(展开)
记录阅读过程中出现的问题
1. 第二章最开始如果出现报错: URLError: <urlopen error [Errno 11004] getaddrinfo failed> 原因:网络问题 最简单的解决办法:是直接下载 https://raw.githubusercontent.com/ageron/handson-ml/master/datasets/housing/housing.tgz ,然后把tgz文件放进datasets/housing/
(展开)
《机器学习实战》读后感
这是一本很实用的《机器学习实战》入门书籍,非常值得入手: 第一,这本书的语言简洁明了,没有艰难的数学推导和深奥的概念。作者通过通俗易懂的语言和生动的实例,并配合详细的代码实现,让读者能够很快掌握各种机器学习算法的原理和应用。 第二,本书的组织结构非常清晰。从...
(展开)
> 更多书评 14篇
论坛 · · · · · ·
在这本书的论坛里发言这本书的其他版本 · · · · · · ( 全部9 )
-
机械工业出版社 (2020)9.5分 343人读过
-
O'Reilly Media (2017)9.2分 387人读过
-
O′Reilly (2019)9.7分 153人读过
-
机械工业出版社 (2018)8.3分 141人读过
以下书单推荐 · · · · · · ( 全部 )
- IT (TR)
- 数学 (豆友zyVU00TRA8)
- 人工智能:从入门到专业 (王元丰)
- 书单|机器学习 (Hao)
- AI (小卖部的养乐多)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有122人想读,手里有一本闲着?
订阅关于机器学习实战(原书第3版)的评论:
feed: rss 2.0










4 有用 飞林沙 2025-06-30 11:58:17 上海
当作一个 sklearn 常用的方法和函数的使用手册快速过一下,把第一部分的代码敲一下就好了,传统机器学习相关的知识都很简单~ 后面的 TF 和 Keras 看的必要性不大,毕竟已经是 PyTorch 的天下了。
2 有用 。。。 2025-04-29 03:21:29 新疆
当年本科对 ai 感兴趣的时候的 入门书籍,靠着这些基础研究生文跨理换成人工智能专业了,现在在搞多模态视觉任务。如果是计算机或 ai 的,这本书学了就当玩玩,原因 1.没有 pytorch;2.想搞 ai,看论文比看这玩意有用的多的多的多。其他专业,像生物或者食品这种重实验轻分析的专业,这本书还是可以的(我对象就是搞食品的,我看她的 SCI 论文里的确研究方法和这本书水平持平)。
2 有用 Faseovergang 2025-02-17 01:53:17 上海
这本书很值得读, 但其实还难评价的, 你说他观点高吧, 观点很工程化, 你说他观点不高吧, 在工程的角度来说一致性非常非常好. 哪怕我搞科研来用都觉得非常受用. 但这本书也有点实际的问题, 第一 DL 的模型整理不好, 现在 DL 发展太快了, 组件是最好有一个结构和对应问题的. 第二 毫无必要把强化学习搞进来, 你又说不清楚 SARSA, PPO, SAC 这些玩意, 因为采取了一种工程视角, ... 这本书很值得读, 但其实还难评价的, 你说他观点高吧, 观点很工程化, 你说他观点不高吧, 在工程的角度来说一致性非常非常好. 哪怕我搞科研来用都觉得非常受用. 但这本书也有点实际的问题, 第一 DL 的模型整理不好, 现在 DL 发展太快了, 组件是最好有一个结构和对应问题的. 第二 毫无必要把强化学习搞进来, 你又说不清楚 SARSA, PPO, SAC 这些玩意, 因为采取了一种工程视角, 强化学习逻辑插进来就很诡异. 第三 当然这个和书的出版时间有关系, 该更新 PyTorch 的玩法了. (展开)
0 有用 孤城以西 2025-11-17 13:49:04 澳大利亚
这第三版的印刷错误简直多到离谱。 前面我都忍了,第8.6节导入的LDA函数名称居然写成LinearDiscrimiSSSSnantAnalysis,忍无可忍。
0 有用 Heisenberg 2025-04-09 12:47:07
刚看了两章,非常棒,很对我胃口。 吾生有涯,没必要也不应该把所有细节全学一遍。 有方法,有评价标准。那就可以开干了,先干起来,再干中学。