《Python数据分析基础教程(第2版)》试读:译 者 序

NumPy,即Numeric Python的缩写,是一个优秀的开源科学计算库,并已经成为Python科学计算生态系统的重要组成部分。NumPy为我们提供了丰富的数学函数、强大的多维数组对象以及优异的运算性能。尽管Python作为流行的编程语言非常灵活易用,但它本身并非为科学计算量身定做,在开发效率和执行效率上均不适合直接用于数据分析,尤其是大数据的分析和处理。幸运的是,NumPy为Python插上了翅膀,在保留Python语言优势的同时大大增强了科学计算和数据处理的能力。更重要的是,NumPy与SciPy、Matplotlib、SciKits等其他众多Python科学计算库很好地结合在一起,共同构建了一个完整的科学计算生态系统。毫不夸张地讲,NumPy是使用Python进行数据分析的一个必备工具。 说起NumPy,我是在数据的“赛场”上与之结缘的。出于对数据挖掘和机器学习的爱好,我与中国科学院和北京大学的同学一起组建了一支名为BrickMover的“比赛小分队”,队友包括庞亮、石磊、刘旭东、黎强、孙晗晓、刘璐等。我们先后参加了一些国内外的数据挖掘比赛,包括百度电影推荐系统算法创新大赛、首届中国计算广告学大赛暨RTB算法大赛、RecSys Challenge 2013、ICDM Contest 2013等,并且取得了还算不错的成绩。无一例外的是,这些比赛均需要对数据进行快速、全面的分析。感谢NumPy,它正是我们使用的数据分析利器之一。 本书作为NumPy的入门教程,从安装NumPy讲起,涵盖NumPy数组对象、常用函数、矩阵运算、线性代数、金融函数、窗函数、质量控制、Matplotlib绘图、SciPy简介以及Pygame等内容,涉及面较为广泛。书中对每个知识点均给出了简短而明晰的示例,很适合初学者上手。大部分示例都有真实的应用场景(如股票数据分析),可读性远远好于枯燥的官方文档,帮助读者在掌握NumPy使用技能的同时拓宽视野、拓展思维。本书的阅读门槛不高,读者只需具备基本的Python编程知识。 在翻译本书的过程中,我发现原作有不少地方不够严谨,甚至还有一些错误。经过反复核对确认,我已经修改了发现的错误,并在我认为不够严谨的地方以译者注的形式给出了自己的理解,供读者参考。此外,原书中的配图为屏幕截图,清晰度较低。为了读者获得最佳的阅读体验,我将书中的代码全部运行了一遍,并输出矢量图以替换原有的配图。需要说明的是,书中部分代码将会在线下载最近一年的股价数据,即数据的时间区段取决于代码运行时的日期。因此,这部分代码对应的新配图会与原书中的配图稍有差异,但对读者不会有任何影响。 感谢我的研究生导师王斌老师的力荐,他让我有幸成为本书的译者。王老师已有《信息检索导论》《大数据:大规模互联网数据挖掘与分布式处理》《机器学习实战》等诸多译著。他并不满足于自己畅读国外的优质书籍,而是字斟句酌、不辞辛劳地完成同样优质的译作与广大中文读者共飨,这份精神让我深受鼓舞。也正因为此,我才鼓起勇气接受了这次自我挑战,不遗余力地完成了人生第一次翻译工作。在这个过程中,要感谢图灵公司的李松峰老师对译稿提出细致严谨的修改意见,感谢傅志红、朱巍、毛倩倩、程芃等出版界同仁在审校、编辑阶段给予的帮助。最后,感谢我的家人,以及BrickMover Team的小伙伴们对翻译本书的支持。 由于自己的专业水平和翻译能力十分有限,加上时间仓促,译稿中的疏漏之处在所难免,恳请读者谅解。希望读者通过新浪微博@张驭宇UCAS和个人邮箱i@zhangyuyu.com,不吝提出宝贵的修改意见和建议,共同努力不断完善译稿。 对于每一个期望快速了解NumPy,却又担心自己迷失在浩如烟海的官方文档中的人,这本书值得一读。 张驭宇 2013年11月于中关村

>Python数据分析基础教程(第2版)

Python数据分析基础教程(第2版)
作者: 伊德里斯 (Ivan Idris)
副标题: NumPy学习指南
isbn: 7115339406
书名: Python数据分析基础教程(第2版)
页数: 226
译者: 张驭宇
定价: 49.00元
原作名: NumPy beginner’s guide,second edition
出版社: 人民邮电出版社
装帧: 平装
出版年: 2014-1-1