【勘误】学习Python,从数据分析到人工智能
感谢读者们的反馈🙏。勘误列表:https://github.com/iamseancheney/python_for_data_analysis_3rd_study_note/blob/main/%E5%8B%98%E8%AF%AF.md
2017年9月,我以SeanCheney作为网名,在互联网上写作、翻译了一系列文章,内容包括Python数据分析、爬虫、机器学习。出乎意料地,在随后的五年时间里,我得以接触到成千上万的读者。读者中既有学习各种专业的学生,也有从事不同行业的职场人士。这让我认识到,除了程序员,越来越多的人正在学习数据分析。身处大数据时代,数据分析能力正逐渐成为现代人不可或缺的一项技能。
在数据分析领域,本书是最值得阅读的图书之一。首先,Python这门语言非常适合初学者。得益于简洁的语法,Python代码的可读性非常好,即便是非计算机专业的读者也能快速掌握。本书正是以Python作为编程语言,来讲解数据分析的,不仅学习门槛低,而且上手快。其次,对于已经入门Python的读者,数据分析是非常好的进阶学习内容。其次,当掌握数据分析之后,无论是继续学习机器学习或深度学习,还是学习量化金融,都是很好的选择。Pandas库是使用Python进行数据分析最主要的工具,而本书作者正是Pandas库的创建者,因此对知识点的讲解十分亲切、流畅、自然。最后,本书提供了非常丰富的学习内容,涉及机器学习、统计、时间序列分析、数据可视化。经过三版的迭代,本书的知识体系更加合理和系统性。如果读者们能跟随本书示例学习并勤加练习,一定能收获学习和精进的乐趣。
本书第三版最大的变化是紧贴Pandas的升级进行扩展,将Pandas升级为1.4.0、Python升级为3.10,主要是新增了方法和特性的内容。作者为第11章“时间序列”新增了分组时间重采样,并将第二版中第12章的内容前置到新版第7章中。曾经不止一次听别人抱怨,Pandas的知识点分散、零碎、不便于记忆,作者在细节上也对此进行了改进。在新版中,作者摒弃了许多容易造成记忆混乱的用法,比如,用axis = "columns"替代axis = 1。简写方式破坏了代码的可读性,作者修改了许多类似的编程细节。新版对初学者更为友好了!
早在Python成为主力的数据分析工具之前,Excel、MATLAB、R都是强有力的竞争者。Python能后来居上,除了它极易上手的特性,主要还是归功于开源。本书作者Wes McKinney是开源界的先锋,他早年创建了Pandas,后来完全依托开源社群对其维护。社群中不乏优秀的开发者,众人合力推动Pandas持续进步,Pandas才有如今的影响力。正是因为这种纯粹的开源理念,Wes专门为本书第三版搭建了开源的网页版本,相信Pandas社区不仅会进一步壮大,还会迎来一大批新用户和读者。