挺好的,任何人看了都能学到不少东西
挺不错的,推荐做ML的同学都拿来看看,一定能学到不少东西,尤其是接触没多久的
不足之处是例子还是稍显不足,我个人更想要Kaggle真题解析
一些我比较喜欢的地方如下
1. 2-3章适合所有刚接触数据科学的同学
第2章 California housing(加州区域房价)的例子非常实际,能学到很多best practice, 怎么写代码、分析数据等等

第3章 以讲解MNIST为例,对基本概念的介绍非常好 (confusion maxtrix, ROC等等)


第5章 svm soft margin vs. hard margin

2. 神经网络的基本概念介绍得不错
- CNN: 做视觉分类 (架构设计类似于缩减、逐层抽象,如图)

- RNN (i.e. LSTM): 做时间相关的预测 (架构设计在于时间变化,如图) ,以及一般涉及到顺序的事情(NLP,翻译).

和传统NN的差别在于,输入不止来源于上一层,也来自于上一个时间状态的hidden layer(下图)

- autoencoder: 根据输入自动生成相似的内容。重点在于输入与输出是同维的,而中间的维度是低维的,强制性让神经网络学会具有代表性的特征,而不是直接的复制输入到输出

- reinforcement learning: 打游戏
看了写的代码也觉得这东西没以前那么高深了....
3. 代码值得过一遍
https://github.com/ageron/handson-ml
有时候看书感觉很复杂,看代码反而很简洁
而且不断在更新,书中一些错误也在代码中做了补充
4. 一些完整的例子(代码)很有学习价值
- California Housing, 第2章
- Titanic (Kaggle), 第3章
- Spam Filter, 第3章
- MINST, 第2/13章,包括了用深度学习来做的例子
- Pacman, 第16章
本书的不足
1. 实战例子略少
入门级的推荐 https://www.tensorflow.org/tutorials/ (主要是开头的的几个案例)
可以极快(1天之内),搞明白tensorflow是咋回事
难度稍大的,推荐Kaggle历年真题解析: http://ndres.me/kaggle-past-solutions/
在熟悉了基本的ML后,可以挑自己感兴趣的问题,看别人是怎么分析数据、解题的,非常有帮助
2. 一些新的神经网络架构
GAN, Capsnet, Transformer...
感想:目前对NN和ML的业界应用还不算了解,但是感觉对于数据的处理是非常general的,似乎达到一个一般的水平就算不错?(就定量预测/回归而言)