内容简介 · · · · · ·
周志华老师的《机器学习》(俗称“西瓜书”)是机器学习领域的经典入门教材之一。本书共16章,与“西瓜书”章节、公式对应,每个公式的推导和解释都以本科数学基础的视角进行讲解,希望能够帮助读者快速掌握各个机器学习算法背后的数学原理。
本书思路清晰,视角独特,结构合理,可作为高等院校计算机及相关专业的本科生或研究生教材,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。
作者简介 · · · · · ·
谢文睿
北京工业大学硕士,Datawhale 开源项目负责人,百度算法工程师,研究方向为机器学习与自然语言处理。
秦州
康奈尔大学计算机硕士,Datawhale 成员,阿里巴巴算法专家,研究方向为图计算与自然语言处理,在 NeurIPS、AAAI、CIKM 等会议上录用多篇学术论文并获得 CIKM 2019 最佳应用论文奖。
贾彬彬
工学博士,兰州理工大学讲师,研究方向为机器学习与数据挖掘,在 TKDE、TNNLS、PRJ、ICML、AAAI 等期刊和会议上共发表学术论文十余篇,并担任 ICML、NeurIPS、ICLR、AAAI、IJCAI 等会议的程序委员会委员(PC Member)。
目录 · · · · · ·
序
前言
主要符号表
资源与支持
第1章 绪论
1.1 引言
1.2 基本术语
1.3 假设空间
1.4 归纳偏好
第2章 模型评估与选择
2.1 经验误差与过拟合
2.2 评估方法
2.3 性能度量
2.4 比较检验
2.5 偏差与方差
第3章 线性模型
3.1 基本形式
3.2 线性回归
3.3 对率回归
3.4 线性判别分析
3.5 多分类学习
3.6 类别不平衡问题
第4章 决策树
4.1 基本流程
4.2 划分选择
4.3 剪枝处理
4.4 连续值与缺失值
4.5 多变量决策树
第5章 神经网络
5.1 神经元模型
5.2 感知机与多层网络
5.3 误差逆传播算法
5.4 全局最小与局部极小
5.5 其他常见神经网络
5.6 深度学习
第6章 支持向量机
6.1 间隔与支持向量
6.2 对偶问题
6.3 核函数
6.4 软间隔与正则化
6.5 支持向量回归
6.6 核方法
第7章 贝叶斯分类器
7.1 贝叶斯决策论
7.2 极大似然估计
7.3 朴素贝叶斯分类器
7.4 半朴素贝叶斯分类器
7.5 贝叶斯网
7.6 EM算法
第8章 集成学习
8.1 个体与集成
8.2 Boosting
8.3 Bagging与随机森林
8.4 结合策略
8.5 多样性
8.6 Gradient Boosting、GBDT、XGBoost的联系与区别
第9章 聚类
9.1 聚类任务
9.2 性能度量
9.3 距离计算
9.4 原型聚类
9.5 密度聚类
9.6 层次聚类
第10章 降维与度量学习
10.1 预备知识
10.2 矩阵的F范数与迹
10.3 k近邻学习
10.4 低维嵌入
10.5 主成分分析
10.6 核化线性降维
10.7 流形学习
10.8 度量学习
第11章 特征选择与稀疏学习
11.1 子集搜索与评价
11.2 过滤式选择
11.3 包裹式选择
11.4 嵌入式选择与L1正则化
11.5 稀疏表示与字典学习
11.6 压缩感知
第12章 计算学习理论
12.1 基础知识
12.2 PAC学习
12.3 有限假设空间
12.4 VC维
12.5 Rademacher复杂度
12.6 定理12.6的解释
12.7 稳定性
第13章 半监督学习
13.1 未标记样本
13.2 生成式方法
13.3 半监督SVM
13.4 图半监督学习
13.5 基于分歧的方法
13.6 半监督聚类
第14章 概率图模型
14.1 隐马尔可夫模型
14.2 马尔可夫随机场
14.3 条件随机场
14.4 学习与推断
14.5 近似推断
14.6 话题模型
第15章 规则学习
15.1 剪枝优化
15.2 归纳逻辑程序设计
第16章 强化学习
16.1 任务与奖赏
16.2 K-摇臂赌博机
16.3 有模型学习
16.4 免模型学习
16.5 值函数近似
· · · · · · (收起)
前言
主要符号表
资源与支持
第1章 绪论
1.1 引言
1.2 基本术语
1.3 假设空间
1.4 归纳偏好
第2章 模型评估与选择
2.1 经验误差与过拟合
2.2 评估方法
2.3 性能度量
2.4 比较检验
2.5 偏差与方差
第3章 线性模型
3.1 基本形式
3.2 线性回归
3.3 对率回归
3.4 线性判别分析
3.5 多分类学习
3.6 类别不平衡问题
第4章 决策树
4.1 基本流程
4.2 划分选择
4.3 剪枝处理
4.4 连续值与缺失值
4.5 多变量决策树
第5章 神经网络
5.1 神经元模型
5.2 感知机与多层网络
5.3 误差逆传播算法
5.4 全局最小与局部极小
5.5 其他常见神经网络
5.6 深度学习
第6章 支持向量机
6.1 间隔与支持向量
6.2 对偶问题
6.3 核函数
6.4 软间隔与正则化
6.5 支持向量回归
6.6 核方法
第7章 贝叶斯分类器
7.1 贝叶斯决策论
7.2 极大似然估计
7.3 朴素贝叶斯分类器
7.4 半朴素贝叶斯分类器
7.5 贝叶斯网
7.6 EM算法
第8章 集成学习
8.1 个体与集成
8.2 Boosting
8.3 Bagging与随机森林
8.4 结合策略
8.5 多样性
8.6 Gradient Boosting、GBDT、XGBoost的联系与区别
第9章 聚类
9.1 聚类任务
9.2 性能度量
9.3 距离计算
9.4 原型聚类
9.5 密度聚类
9.6 层次聚类
第10章 降维与度量学习
10.1 预备知识
10.2 矩阵的F范数与迹
10.3 k近邻学习
10.4 低维嵌入
10.5 主成分分析
10.6 核化线性降维
10.7 流形学习
10.8 度量学习
第11章 特征选择与稀疏学习
11.1 子集搜索与评价
11.2 过滤式选择
11.3 包裹式选择
11.4 嵌入式选择与L1正则化
11.5 稀疏表示与字典学习
11.6 压缩感知
第12章 计算学习理论
12.1 基础知识
12.2 PAC学习
12.3 有限假设空间
12.4 VC维
12.5 Rademacher复杂度
12.6 定理12.6的解释
12.7 稳定性
第13章 半监督学习
13.1 未标记样本
13.2 生成式方法
13.3 半监督SVM
13.4 图半监督学习
13.5 基于分歧的方法
13.6 半监督聚类
第14章 概率图模型
14.1 隐马尔可夫模型
14.2 马尔可夫随机场
14.3 条件随机场
14.4 学习与推断
14.5 近似推断
14.6 话题模型
第15章 规则学习
15.1 剪枝优化
15.2 归纳逻辑程序设计
第16章 强化学习
16.1 任务与奖赏
16.2 K-摇臂赌博机
16.3 有模型学习
16.4 免模型学习
16.5 值函数近似
· · · · · · (收起)
原文摘录 · · · · · ·
-
写此序之时,我们正面临 ChatGPT 带来的一场技术革命。个人认为,这场革命将会不断持续下去,其影响将十分深远,会触及整个社会的方方面面。我相信人工智能再也无法走出大家的视野。了解、理解人工智能将会成为每个人最基本的能力。 大家知道,机器学习是这些年来人工智能中最核心的技术。学好机器学习,也将是学好人工智能的关键所在,而这本书会助你一臂之力。 这本书的第 1 版出版之后,大受读者欢迎。在收到众多读者反馈意见的基础上,第 2 版从多个方面进行了补充和修订,相信这一版会给读者带来更多的收获。 虽然与本书的作者素不相识、从未谋面,但是在看过书稿之后,我便很乐意并且感觉很荣幸有机会给这本书写序。 这是一本与众不同的书。 首先,确切地说,这是一本“伴侣书”。类似于咖啡伴侣,这本书是周志华教授的“西瓜书”一一《机器学习》的伴侣书,它还有一个可爱的名字 一“南瓜书”。“南瓜书”对“西瓜书”中的公式进行了解析,并补充了必要的推导过程:在推导公式的过程中,有时候需要一些先验知识,作者为此也进行了必要的补充。上述做法对学习机器学习时“知其然”并“知其所以然”非常重要。虽然现在能用一些机器学习工具来实现某个任务的人越来越多了,但是具有机器学习思维且了解其原理,从而能够解决实际问题的能力在工作中更重要,具有这种能力的人也更具有竞争力。 其次,这是一本通过开源方式多人协作写成的书。这种多人分工合作、互相校验、开放监督的方式,既保证了书的内容质量,也保证了写作的效率。在我看来,这是一种站在读者角度且非常先进的生产方式,容易给读者带来很好的体验。 最后,我想说,这是一本完全根据学习经历编写而成的书。也就是说,这本书完全从读者学习的角度出发,分享了作者在学习中遇到的一些“坑”以及跳过这些“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。其实,每个人在学习一门新的课程时... (查看原文) —— 引自章节:序(王斌 小米AI 实验室主任、NLP 首席科学家) -
由于国内相关资料的匮乏,机器学习算法的公式推导历来都被认为是初学者的“噩梦”。笔者两年前也受到了相同的困扰,但是在笔者师兄的鼓励下,笔者开始尝试做读书笔记,经年累月遂有了编著本书的基本素材,本书就是以笔者拜读周志华老师的《机器学习》 (俗称“西瓜书”)时记下的笔记为蓝本编著的。“西瓜书"作为机器学习领域的经典中文著作,已经成为相关从业人员和学习者的必读书目,周老师为了兼顾更多读者,在“西瓜书”中尽可能少地使用数学知课,然而这对笔者这类对公式推导感兴趣的读者来说就颇费思量。为此,便在“西瓜书”的其础上,对其中的重难点公式进行一些补充,具体地说,本书会对“西瓜书”中缺少推导细节的公式补充了详细的推导过程,对不太易懂的公式补充解析。 全书的章节编排和“西瓜书”保持一致,共16章,各章中的内容都对应“西瓜书”中相应章节与公式,为了尽可能地降低阅读门槛,本书以本科数学视角编写,所以有本科数学基础的读者,基本都能畅读本书,对于超过本科数学范围的数学知识,本书都会在相应章节附上详细讲解的附注,以及具体的参考文献,读者可以按图索骥,拓展阅读,由于本书主要是对“西瓜书”进行的补充,所以在编写具体章节内容时,默认读者已经阅读过“西瓜书”相应章节。 本书需要搭配“西瓜书”一起阅读,在阅读“西瓜书”的过程中,当遇到推导不明日的公式时再来查阅本书,效果最佳。 (查看原文) —— 引自章节:前言
喜欢读"机器学习公式详解 (第2版)"的人也喜欢 · · · · · ·
机器学习公式详解 (第2版)的书评 · · · · · · ( 全部 17 条 )
这本“南瓜书”要和“西瓜书”配套阅读
这篇书评可能有关键情节透露
虽然与本书的编著者素不相识、从未谋面,但是看过书稿之后,我便很乐意也感觉很荣幸有机会给这书写序. 这是一本与众不同的书. 首先,确切地说,这是一本“伴侣书”. 类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”——《机 器学习》的伴侣书,它也有一个可爱的名字 ——... (展开)遇到西瓜书的困难不要怕,微笑着手持南瓜书面对它,加油奥利给!
南瓜书 的内容很早就开源在了github上,现终于出版赶紧买来支持。印象非常深刻的是,最早与它相识是因为公式10.17的推导,翻遍了几乎全部的地方不得解,直到看到了南瓜书上所介绍的Lagrangian Optimization with Matrix Constrains方法才逐步完全弄懂,剩下的此类例子也有不少...
(展开)
值得新手入手的机器学习书
南瓜书非常不错,对西瓜书上许多未解释清的公式都做了详细解释,并进行分析。同时还对西瓜书上的一些错误的公式进行修正,并对一些数学知识进行详细补充。笔者认为若只是单纯看南瓜书对新手挺难,西瓜书配合南瓜书更容易上手。因此强烈推荐这本书,搭配着西瓜书进行学习。 同时...
(展开)
2023 年的第 11 本书——《机器学习公式详解》
终于从头到尾啃了一遍周志华老师的《西瓜书》,在阅读 csdn 博客的时候偶然看到了有网友提到"南瓜书",跑到微信读书上搜了一通,竟然可以阅读。 作者还是很耐心,对于复杂的公式一步步的推导求导,力求照顾数学小白的阅读感受。可是"没有最白,只有更白",我这种数学小白中的战...
(展开)
推荐应对面试的两本宝典:“西瓜书”和“南瓜书”
“南瓜书”《机器学习公式详解》作者谢老师和异步君说:"刚刚收到的一份实习生的简历,我点进去他的GitHub看到了EasyRL项目",大家都猜测他们刚好在学强化学习提升自己,为接下来的面试做准备。 EasyRL是 Datawhale 团队一个强化学习教程的开源项目,在 GitHub 上有 4600 多个 ...
(展开)
> 更多书评 17篇
论坛 · · · · · ·
在这本书的论坛里发言这本书的其他版本 · · · · · · ( 全部2 )
-
人民邮电出版社 (2021)9.6分 78人读过
以下书单推荐 · · · · · · ( 全部 )
- 计算机方向国人写的高分书 (damengxinfa02)
- 机器学习 (Shylock_)
- 机器学习入门到进阶 (马丁的一天)
- 书单|AI (AndyRon)
- 未评分书 (北风)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有56人想读,手里有一本闲着?
订阅关于机器学习公式详解 (第2版)的评论:
feed: rss 2.0

3 有用 异步图书 2023-05-31 10:13:44 北京
相较于第1版,除了篇幅上从168页扩充到308页,《机器学习公式详解(第2版)》呈现出4大亮点: 1、对“西瓜书”中除了公式以外的重难点内容加以解析; 2、以过来人的视角给出学习建议; 3、对比较难理解的公式和重点内容扩充具体的例子说明; 4、对跳步过大的公式补充具体的推导细节。 从基础公式解析到难点探讨,无论你数学功底如何,都可以在《机器学习公式详解(第2版)》里找到你想要的。
3 有用 PatrickL 2023-06-25 14:48:15 上海
第2版与第1版的区别在于,第2版不仅像第1版那样对难点公式做了必要的推导和解释,还对每一章节做了概述,并且帮助读者梳理了相关的先验知识,解释了很多重要的概念。
0 有用 Marvin不慌 2023-06-19 11:34:17 北京
第二版比第一版更丰富了,西瓜书的知识点和公式解读,辅助理解,增加了许多数学知识的解读。适合机器学习理论研究打基础,将机器学习应用到具体场景。
0 有用 阿修 2025-06-02 15:13:34 广东
第二版比第一版明显好多了,至少认真了很多,再接再厉吧