作者:
[美]加雷斯·詹姆斯
/
[美]丹妮拉·威腾
/
[美]特雷弗·哈斯帖
/
[美]罗伯特·提布施瓦尼
译者: 王星 / 陈志豪
出版社: 机械工业出版社
出版年: 2024-10
ISBN: 9787111761761
页数: 456
装帧: 平装
定价: 109.00元
原作名: An Introduction to Statistical Learning, with Applications in R, 2e
丛书: 统计学精品译丛
译者: 王星 / 陈志豪
出版社: 机械工业出版社
出版年: 2024-10
ISBN: 9787111761761
页数: 456
装帧: 平装
定价: 109.00元
原作名: An Introduction to Statistical Learning, with Applications in R, 2e
丛书: 统计学精品译丛
豆瓣评分
内容简介 · · · · · ·
本书介绍了一些重要的建模和预测技术以及相关应用,涵盖以下主题:线性回归、分类、重采样方法、收缩方法、基于树的方法、支持向量机、聚类、深度学习、生存分析、多重测试等。书中每一章都包含一个教程,通过图形和实例介绍如何实现R语言提供的分析方法。本书还提供了关于深度学习、生存分析和多重测试的新章节,以及朴素贝叶斯、广义线性模型、贝叶斯加性回归树和矩阵补全的扩展内容,并对R代码进行了全面更新。本书旨在帮助科学、工业和其他领域的从业人员学习和应用这些统计学习技术。
作者简介 · · · · · ·
加雷斯·詹姆斯(Gareth James) 斯坦福大学统计学博士,师从Trevor Hastie。埃默里大学数据科学和运筹学教授,E. Morgan Stanley 工商管理主席。他在统计学习领域发表了大量的方法论著作,特别强调高维数据和函数数据。
丹妮拉·威滕(Daniela Witten) 斯坦福大学统计学博士,师从Robert Tibshirani。华盛顿大学统计学与生物统计学教授、Dorothy Gilford 讲席教授。她的研究主要集中在用于分析复杂、混乱和大规模等。
目录 · · · · · ·
译者序
前言
第1章导论1
1.1统计学习概述1
1.2统计学习简史4
1.3关于本书4
1.4本书的读者群6
1.5记号与简单矩阵代数6
1.6本书的内容安排8
1.7用于实验和习题的数据集9
1.8本书网站10
1.9致谢10
第2章统计学习11
2.1什么是统计学习11
2.2评价模型精度21
2.3实验:R语言简介31
2.4习题39
第3章线性回归43
3.1简单线性回归44
3.2多元线性回归51
3.3回归模型中的其他注意事项60
3.4营销计划75
3.5线性回归与K最近邻法的
比较76
3.6实验:线性回归80
3.7习题89
第4章分类95
4.1分类问题概述95
4.2为什么线性回归不可用96
4.3逻辑斯谛回归98
4.4用于分类的生成模型104
4.5分类方法的比较116
4.6广义线性模型121
4.7实验:分类方法126
4.8习题141
第5章重抽样方法146
5.1交叉验证法146
5.2自助法154
5.3实验:交叉验证法和自助法157
5.4习题163
第6章线性模型选择与正则化167
6.1子集选择168
6.2压缩估计方法175
6.3降维方法185
6.4高维问题192
6.5实验:线性模型和正则方法196
6.6习题210
第7章非线性模型214
7.1多项式回归214
7.2阶梯函数216
7.3基函数217
7.4回归样条218
7.5光滑样条223
7.6局部回归225
7.7广义可加模型227
7.8实验:非线性建模230
7.9习题239
第8章基于树的方法242
8.1决策树基本原理242
8.2装袋法、随机森林、提升法和贝叶斯加性回归树250
8.3实验:决策树260
8.4习题267
第9章支持向量机270
9.1最大间隔分类器270
9.2支持向量分类器274
9.3狭义的支持向量机278
9.4多分类的支持向量机283
9.5与逻辑斯谛回归的关系284
9.6实验:支持向量机285
9.7习题293
第10章深度学习297
10.1单隐层神经网络297
10.2多隐层神经网络300
10.3卷积神经网络303
10.4文本分类310
10.5循环神经网络312
10.6深度学习适用场景320
10.7拟合神经网络321
10.8插值和双下降325
10.9实验:深度学习328
10.10习题342
第11章生存分析与删失数据344
11.1生存时间与删失时间344
11.2细说删失345
11.3KaplanMeier生存曲线346
11.4对数秩检验348
11.5生存响应下的回归模型350
11.6Cox模型的压缩357
11.7其他主题359
11.8实验:生存分析361
11.9习题368
第12章无监督学习372
12.1无监督学习的挑战372
12.2主成分分析373
12.3缺失值与矩阵补全382
12.4聚类分析方法386
12.5实验:无监督学习397
12.6习题411
第13章多重检验415
13.1假设检验的快速回顾416
13.2多重检验的挑战420
13.3族错误率421
13.4假发现率428
13.5计算p值和假发现率的重采样
方法431
13.6实验:多重检验436
13.7习题445
· · · · · · (收起)
前言
第1章导论1
1.1统计学习概述1
1.2统计学习简史4
1.3关于本书4
1.4本书的读者群6
1.5记号与简单矩阵代数6
1.6本书的内容安排8
1.7用于实验和习题的数据集9
1.8本书网站10
1.9致谢10
第2章统计学习11
2.1什么是统计学习11
2.2评价模型精度21
2.3实验:R语言简介31
2.4习题39
第3章线性回归43
3.1简单线性回归44
3.2多元线性回归51
3.3回归模型中的其他注意事项60
3.4营销计划75
3.5线性回归与K最近邻法的
比较76
3.6实验:线性回归80
3.7习题89
第4章分类95
4.1分类问题概述95
4.2为什么线性回归不可用96
4.3逻辑斯谛回归98
4.4用于分类的生成模型104
4.5分类方法的比较116
4.6广义线性模型121
4.7实验:分类方法126
4.8习题141
第5章重抽样方法146
5.1交叉验证法146
5.2自助法154
5.3实验:交叉验证法和自助法157
5.4习题163
第6章线性模型选择与正则化167
6.1子集选择168
6.2压缩估计方法175
6.3降维方法185
6.4高维问题192
6.5实验:线性模型和正则方法196
6.6习题210
第7章非线性模型214
7.1多项式回归214
7.2阶梯函数216
7.3基函数217
7.4回归样条218
7.5光滑样条223
7.6局部回归225
7.7广义可加模型227
7.8实验:非线性建模230
7.9习题239
第8章基于树的方法242
8.1决策树基本原理242
8.2装袋法、随机森林、提升法和贝叶斯加性回归树250
8.3实验:决策树260
8.4习题267
第9章支持向量机270
9.1最大间隔分类器270
9.2支持向量分类器274
9.3狭义的支持向量机278
9.4多分类的支持向量机283
9.5与逻辑斯谛回归的关系284
9.6实验:支持向量机285
9.7习题293
第10章深度学习297
10.1单隐层神经网络297
10.2多隐层神经网络300
10.3卷积神经网络303
10.4文本分类310
10.5循环神经网络312
10.6深度学习适用场景320
10.7拟合神经网络321
10.8插值和双下降325
10.9实验:深度学习328
10.10习题342
第11章生存分析与删失数据344
11.1生存时间与删失时间344
11.2细说删失345
11.3KaplanMeier生存曲线346
11.4对数秩检验348
11.5生存响应下的回归模型350
11.6Cox模型的压缩357
11.7其他主题359
11.8实验:生存分析361
11.9习题368
第12章无监督学习372
12.1无监督学习的挑战372
12.2主成分分析373
12.3缺失值与矩阵补全382
12.4聚类分析方法386
12.5实验:无监督学习397
12.6习题411
第13章多重检验415
13.1假设检验的快速回顾416
13.2多重检验的挑战420
13.3族错误率421
13.4假发现率428
13.5计算p值和假发现率的重采样
方法431
13.6实验:多重检验436
13.7习题445
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
-
1. 是否至少一个自变量能够预测因变量 2. 预测因变量的究竟是所有自变量,还是部分自变量 3. 模型究竟有多准? 4. 就已有的自变量数据,究竟该预测怎样的因变量,以及预测地有多准 (查看原文) —— 引自第75页 -
It turns out that R2 will always increase when more variables are added to the model, even if those variables are only weakly associated with the response. (查看原文) —— 引自第75页
> 全部原文摘录
丛书信息
· · · · · ·
统计学精品译丛(共26册),
这套丛书还有
《线性回归分析导论》《高维统计学》《例解回归分析(原书•第5版)》《概率与统计》《高维概率及其在数据科学中的应用》
等
。
统计学习导论的书评 · · · · · · ( 全部 39 条 )
这是一本很好的机器学习的入门书(最后附上书和课后习题解答的英文版)
这本书读起来不费劲,弱化了数学推导过程,注重思维的直观理解和启发。读起来很畅快,个人感觉第三章线性回归写的很好,即使是很简单的线性模型,作者提出的几个问题和细细的解释这些问题对人很有启发性,逻辑梳理得很好,也易懂。(不过有点可惜的是翻译版本确实不是太好,有些...
(展开)
烂到天地惊:王星《统计学习导论》翻译恶搞记
继续上图,继续欣赏王星团队是如何恶搞《统计学习导论》的。 ================ 10.2.3关于PCA(主成分分析)的其他方面,P264 王星:变量的标准化........变量是否分别被标准化了(每个变量乘以一个不同的常数)。 点评:稍微有点统计常识的人都知道,“标准化”这个词要慎重使...
(展开)
王星团队=盲人组合?王星《统计学习导论》翻译批评
如果图上画的是一头大象,有人说成那是针; 如果此人频繁犯类似的错误,那么我们有理由怀疑他是个瞎子。 =============== 第6章,线性模型选择与正则化 P150,图6-5下面一段,第二行 王星:与右图相比,左图拟合效果更佳光滑,因此偏差下降,方差上升。 原文: Now as we move...
(展开)
《统计学习导论》什么烂翻译??
原著是很好的书,但是这个译本像是英文水平不咋样且完全没有专业知识的外行翻译的一样!有些地方用语不够专业,有些地方可以说是完全错误,非常误导初学者,哪怕是有基础的人看到某些片段都要疑惑半天。中英对照地看完,只能说这翻译水平还不如DeepL。 举个例子,书中竟然把函...
(展开)
臭气熏天:王星教授将《统计学习导论》翻译成了垃圾
王星教授带领豪华团队,“倾情翻译大半年”,硬生生地将这本书翻译成了一堆垃圾。 我丝毫不怀疑国内还有比王星团队更烂的,但我非常怀疑,是否存在烂到不知道自己烂的团队。 =========== 如果将这个团队集中起来,让他们挨个站出来,出现一次错误就轻轻地打一个耳光,然后下次...
(展开)
> 更多书评 39篇
论坛 · · · · · ·
在这本书的论坛里发言这本书的其他版本 · · · · · · ( 全部7 )
-
机械工业出版社 (2015)8.4分 175人读过
-
Springer (2013)9.6分 701人读过
-
Springer (2021)9.6分 25人读过
-
Springer (2023)暂无评分 14人读过
以下书单推荐 · · · · · · ( 全部 )
- 与环境的互操作数据流----数字化核心6 (小毛叔)
- 美国大学AI for Finance教材 (晏初)
- 数据科学(统计学) (小行星猎人)
- 人工智能与数字化----数字化核心1 (小毛叔)
- 我最爱读的统计经典
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有32人想读,手里有一本闲着?
订阅关于统计学习导论的评论:
feed: rss 2.0
0 有用 魏哲煊 2026-02-05 23:20:38 江西
优点:作为statistical learning来说比较详略得当,思想介绍到位,对数学要求是诸多SL教材里比较低的,注重R在实际问题中的应用,跟着敲一遍代码会有很大收获。 缺点:R代码结构不够清晰,有时会有一些奇怪的语法使用,掺杂了作者本人R编程时一些不够详细的坏习惯,最好让ai整理一下,补充必要的参数之后才更好读懂。