离“R的百科全书”又近了一点

我是2014年买的第一版,断断续续看了一些。这次刚好遇到图灵出了第二版,遂买来收藏一番。考虑到《R语言实战(第2版)》比第一版贵了20RMB,厚了近200页,想搞个大新闻,故拿两本书比较一番。
优点
1、第二版在前14章与第一版相差无异。主要是基本的R安装、数据导入、初级数据处理方法、初级可视化(原生绘图方法)、基本统计分析、OLS回归、方差分析与功效分析、重抽样与bootstrap、广义线性模型、PCA与EFA。
读完前14章,能够保证你能基本掌握R的基本操作(下载安装与调用包)、数据处理与统计分析,适宜有一年统计学基础或一学期统计学+一学期计量经济学基础的人阅读。另外,对商科的学生说,看完OLS一章之后就果断抛弃老师在课堂上教给你的EViews和STATA吧,R足够替代这些上世纪的老古董。
2、新增的章节分别是时间序列、聚类分析、分类;ggplot2,高级编程,创建包,创建动态报告(R Markdown, LaTeX)。
时间序列主要是STL时序分解、HoltWinters指数平滑预测、ARIMA。
聚类分析主要是层次聚类与划分聚类(Kmeans、PAM)。
分类方法主要是逻辑回归、决策树、随机森林、SVM。(各种牛逼的分类模型都出现了就问你怕不怕!)
基本没有理论推导,照着代码敲下来你也能用几行代码实现上面那些方法。
3、纸张印刷质量较第一版提升明显。
没说的,淡黄纸张手感顺滑。
4、翻译比较通顺。
基本符合国人的行文习惯,看完整本书也没有明显的翻译腔与不通顺的地方。对现在的译作来说比较难得,辛苦译者们了。
好了,谈完优点,我们来谈谈这本书的缺点。
1、数据处理部分,第二版与第一版一样,没有讲dplyr包。私以为dplyr是数据清洗、合并、重构的大杀器,原生的数据处理方法还是稍显复杂。
2、完全没有理论推导。注意,是“完全”没有。整本书出现的数学公式两只手就能数完。
没有理论推导的坏处是,一切对你而言都是黑箱,你只会依样画葫芦地当一个调包侠,做T检验F检验卡方检验,不知道什么叫弱平稳性的情况下一键生成ARIMA(p,d,q),不知道linear regression与logistic regression如何参数估计(OLS与MLE)的情况下依然能够拟合出一个能work的model。
严格来说,作为一本实战类的书,这一条不能算成是缺点。正所谓术业有专攻,强烈建议把这本书与统计、机器学习的理论书结合着看,疗效会更好。
最后,恭喜你进了R的坑。
Just enjoy it.
优点
1、第二版在前14章与第一版相差无异。主要是基本的R安装、数据导入、初级数据处理方法、初级可视化(原生绘图方法)、基本统计分析、OLS回归、方差分析与功效分析、重抽样与bootstrap、广义线性模型、PCA与EFA。
读完前14章,能够保证你能基本掌握R的基本操作(下载安装与调用包)、数据处理与统计分析,适宜有一年统计学基础或一学期统计学+一学期计量经济学基础的人阅读。另外,对商科的学生说,看完OLS一章之后就果断抛弃老师在课堂上教给你的EViews和STATA吧,R足够替代这些上世纪的老古董。
2、新增的章节分别是时间序列、聚类分析、分类;ggplot2,高级编程,创建包,创建动态报告(R Markdown, LaTeX)。
时间序列主要是STL时序分解、HoltWinters指数平滑预测、ARIMA。
聚类分析主要是层次聚类与划分聚类(Kmeans、PAM)。
分类方法主要是逻辑回归、决策树、随机森林、SVM。(各种牛逼的分类模型都出现了就问你怕不怕!)
基本没有理论推导,照着代码敲下来你也能用几行代码实现上面那些方法。
3、纸张印刷质量较第一版提升明显。
没说的,淡黄纸张手感顺滑。
4、翻译比较通顺。
基本符合国人的行文习惯,看完整本书也没有明显的翻译腔与不通顺的地方。对现在的译作来说比较难得,辛苦译者们了。
好了,谈完优点,我们来谈谈这本书的缺点。
1、数据处理部分,第二版与第一版一样,没有讲dplyr包。私以为dplyr是数据清洗、合并、重构的大杀器,原生的数据处理方法还是稍显复杂。
2、完全没有理论推导。注意,是“完全”没有。整本书出现的数学公式两只手就能数完。
没有理论推导的坏处是,一切对你而言都是黑箱,你只会依样画葫芦地当一个调包侠,做T检验F检验卡方检验,不知道什么叫弱平稳性的情况下一键生成ARIMA(p,d,q),不知道linear regression与logistic regression如何参数估计(OLS与MLE)的情况下依然能够拟合出一个能work的model。
严格来说,作为一本实战类的书,这一条不能算成是缺点。正所谓术业有专攻,强烈建议把这本书与统计、机器学习的理论书结合着看,疗效会更好。
最后,恭喜你进了R的坑。
Just enjoy it.
有关键情节透露