说实话,不太适合入门。
书名叫《数据科学入门》,可实际上却并不适合零基础的人读,需要有一定的基础(包括python基础和数学基础)。我觉得称之为“指南”更合适。 —————————— 当初为什么买这本书? 有段时间对数据异常着迷,只要和数据有关的数都不管三七二十一加到购物车,发工资了就买。到现在淘宝和京东的购物车里还有很多书在吃灰... —————————— 首先,先说下书中提到学习数据科学需要的三个方面基础: 1.数学和统计学知识 2.编程能力 3.领域知识
既然是数据,那就绕不开数学,而数学这块需要具备的基础能力有线性代数、微积分、概率论和统计学。达到什么程度算入门?大学好好听课就行。 再来说说编程能力。现在自助式分析工具非常多,有很多分析师甚至都不会编程,但拥有基础的编程能力(特别是会python),能够跳脱出市面上分析软件的限制,自定义自己心中所想思路和展示。同样,学习编程入门,能看懂简单的代码想表达的逻辑即可。 至于领域知识,那就是各显神通了。想投身电商行业,就得了解电商行业的运作,想投身游戏行业,就得了解游戏行业的运作。这都是靠经验一点一点积累的。 —————————— 将章节拆分下。 书本第2和第3章讲的就是编程能力,主要是基础的python语法和python的可视化。 第4到第7章就是数学的基础,线形代数、概率论和统计学 第8章我不知道该划分到哪,因为我对梯度下降的理解更倾向于是一种算法。要了解本章首先得理解微积分中梯度是什么?然后为什么要下降找到最小值? 第11到第19章就是经典的机器学习算法,每章都是简单的用python代码实现,但有些算法的基础是数学,像线性回归(简单线性回归和多重线形回归)、信息熵,如果没有学过或学透,完全看不懂或者看起来非常吃力。 后面就是一些应用场景——文本分析、网络分析、推荐系统。 —————————— 总的来说, 1.不适合完全没有基础的人,特别是没有学过python,因为本书都是用python代码来实现的。适合有一定数学和python基础的朋友。 2.书中的目录特别有用,介绍的很全面。可以根据每个章节都需要花费大量的时间去打基础——数学基础、编程基础、算法思想。 读完这本书,可以对整个数据科学行业有个简单的全面的了解。仅仅是简单的了解。