代码不坑读者的书就是一本好书
因为对未来大数据的发展感兴趣,我选择了往这条路走。
因为公众号——大数据(微信号:hzdashuju)的无私馈赠,我有幸阅读学习了韦玮老师的这本讲述大数据中数据采集这门绝技的书——《精通python网络爬虫》。
进入正题吧。
书目录我就不占篇幅了,有兴趣的读者可以百度。但很明显你们可以发现,整个目录的编排是从易到难,循序渐进的。即使你是小白,也能从头到尾按照作者的知识点讲解和例子代码走一遍。从基本知识什么是网络爬虫,正则表达式到基本工具fiddler使用,再到整体框架scrapy的实现,到后面的项目实战,爬虫涵盖的主要知识都涉及到了。
我本人就是一个小白,虽然是计算机专业出身,但基本还回给老师了(唯一遗憾的是没有问老师讨学费)。不过这本书讲得比较细致,至少我每个例子都跑通了。相对于我自己买的另一本讲hadoop的书,那书真是让我踩了无数的坑,我一直怀疑作者有没有实践过里面的代码。但这本书起码让人感觉作者应该是都反复跑过的。
本来写简评的,一不小心啰嗦了。我还是作点优缺点总结吧:
优点:
1. 知识点比较全面
2. 通俗易懂,循序渐进
3. 代码都是能跑的(这很重要啊,不挖坑)
不要奢求学了一本书能干什么大事,但起码如果你想从事这行业,多这一项技能既能让你更好地理解技术之间的关联,又能让你在以后的某个时间点帮你一个大忙也说不定。好好利用这个爬虫技术,在大数据分析的前期数据收集阶段,应该蛮有作用的。
缺点:
1. 书中某些例子的链接是引用了作者自己的网站的,但应该是后来网站链接有所改变了,导致有些链接不可用,细心的读者应该能改过来
2. 作者在安装scrapy的经验上走的弯路应该比较少,所以书中提及的安装准备工作和常见问题显得略少,以至于我在安装时出了很多问题,这让我折腾了不少时间。最后我只能乖乖去百度了解安装scrapy前的准备工作有哪些,逐个解决。现祭出安装步骤,给后来者参考,避免踩坑。摘自知乎一答主的答案:https://www.zhihu.com/question/29759650
注:各位可以先按照书本作者的步骤来操作,当遇到问题解决不了了再按照知乎答主的三步来:装wheel——装Twisted——装scrapy。
不过后来,我发现,各个模块安装不成功的主要原因是通讯问题,当通讯断开了,当前模块安装失败,而重新执行安装命令:pip install scrappy==1.1.0rc3,则会自动安装刚才未能成功安装的模块。如果多次断开,实在没办法就先下载没安装的模块的whl文件来安装,再重新执行scrapy安装命令。
因为公众号——大数据(微信号:hzdashuju)的无私馈赠,我有幸阅读学习了韦玮老师的这本讲述大数据中数据采集这门绝技的书——《精通python网络爬虫》。
进入正题吧。
书目录我就不占篇幅了,有兴趣的读者可以百度。但很明显你们可以发现,整个目录的编排是从易到难,循序渐进的。即使你是小白,也能从头到尾按照作者的知识点讲解和例子代码走一遍。从基本知识什么是网络爬虫,正则表达式到基本工具fiddler使用,再到整体框架scrapy的实现,到后面的项目实战,爬虫涵盖的主要知识都涉及到了。
我本人就是一个小白,虽然是计算机专业出身,但基本还回给老师了(唯一遗憾的是没有问老师讨学费)。不过这本书讲得比较细致,至少我每个例子都跑通了。相对于我自己买的另一本讲hadoop的书,那书真是让我踩了无数的坑,我一直怀疑作者有没有实践过里面的代码。但这本书起码让人感觉作者应该是都反复跑过的。
本来写简评的,一不小心啰嗦了。我还是作点优缺点总结吧:
优点:
1. 知识点比较全面
2. 通俗易懂,循序渐进
3. 代码都是能跑的(这很重要啊,不挖坑)
不要奢求学了一本书能干什么大事,但起码如果你想从事这行业,多这一项技能既能让你更好地理解技术之间的关联,又能让你在以后的某个时间点帮你一个大忙也说不定。好好利用这个爬虫技术,在大数据分析的前期数据收集阶段,应该蛮有作用的。
缺点:
1. 书中某些例子的链接是引用了作者自己的网站的,但应该是后来网站链接有所改变了,导致有些链接不可用,细心的读者应该能改过来
2. 作者在安装scrapy的经验上走的弯路应该比较少,所以书中提及的安装准备工作和常见问题显得略少,以至于我在安装时出了很多问题,这让我折腾了不少时间。最后我只能乖乖去百度了解安装scrapy前的准备工作有哪些,逐个解决。现祭出安装步骤,给后来者参考,避免踩坑。摘自知乎一答主的答案:https://www.zhihu.com/question/29759650
注:各位可以先按照书本作者的步骤来操作,当遇到问题解决不了了再按照知乎答主的三步来:装wheel——装Twisted——装scrapy。
不过后来,我发现,各个模块安装不成功的主要原因是通讯问题,当通讯断开了,当前模块安装失败,而重新执行安装命令:pip install scrappy==1.1.0rc3,则会自动安装刚才未能成功安装的模块。如果多次断开,实在没办法就先下载没安装的模块的whl文件来安装,再重新执行scrapy安装命令。
© 本文版权归作者 为感动申号点评 所有,任何形式转载请联系作者。
有关键情节透露