Finding great data analysts is difficult. Despite the explosive growth of data in industries ranging from manufacturing and retail to high technology, finance, and healthcare, learning and accessing data analysis tools has remained a challenge. This pragmatic guide will help train you in one of the most important tools in the field - Python. Filled with practical case studies, ...
Finding great data analysts is difficult. Despite the explosive growth of data in industries ranging from manufacturing and retail to high technology, finance, and healthcare, learning and accessing data analysis tools has remained a challenge. This pragmatic guide will help train you in one of the most important tools in the field - Python. Filled with practical case studies, Python for Data Analysis demonstrates the nuts and bolts of manipulating, processing, cleaning, and crunching data with Python. It also serves as a modern introduction to scientific computing in Python for data-intensive applications. Learn about the growing field of data analysis from an expert in the community. Learn everything you need to start doing real data analysis work with Python Get the most complete instruction on the basics of the "modern scientific Python platform" Learn from an insider who builds tools for the scientific stack Get an excellent introduction for novices and a wealth of advanced methods for experienced analysts
作者简介
· · · · · ·
Wes McKinney 资深数据分析专家,对各种Python库(包括NumPy、pandas、matplotlib以及IPython等)等都有深入研究,并在大量的实践中积累了丰富的经验。撰写了大量与Python数据分析相关的经典文章,被各大技术社区争相转载,是Python和开源技术社区公认的权威人物之一。开发了用于数据分析的著名开源Python库——pandas,广获用户好评。在创建Lambda Foundry(一家致力于企业数据分析的公司)之前,他曾是AQR Capital Management的定量分析师。
书的内容不错,很适合做量化建模工具书,但是这个翻译真是不敢恭维,有些地方翻译的语句不通,有些地方直接译错了,比如刚才看到第220页写的“通常,我们不会使用DataFrame中一个或多个列作为行索引”,感觉这话说反了,看了一下英文原版电子版,原文是“It‘s not unusual to ...
(展开)
还是有一些错误的, 现将自己找到的罗列如下: 1. Chap 9 2016 Federal Election 例子中 def get_top_amounts(group, key, n=5): totals = group.groupby(key)['contb_receipt_amt'].sum() # Order totals by key in descending order return totals.order(ascending=False)[-n:] 应该是返回前n个结果, 所以最后一行应为: return totals.order(ascending=False)[:n] 2. pivot table 相关的 parameter 名称都应为 index 和 columns...
2017-07-12 09:42:27
还是有一些错误的, 现将自己找到的罗列如下:
1. Chap 9 2016 Federal Election 例子中
def get_top_amounts(group, key, n=5):
totals = group.groupby(key)['contb_receipt_amt'].sum()
# Order totals by key in descending order
return totals.order(ascending=False)[-n:] 引自 勘误
What is this book about? 本书主要讨论在Python下如何处理、管理、清除数据,一并介绍了在Python下如何进行科学计算技术。书中还介绍了Python语言和python标准库通过python提供的标准库可以有效的解决您在用Python进行大数据处理。 书中提到的“数据”泛指: 1)矩阵或者说多维数组 2)表格(类似Excel、Calc) 3)诸如SQL关系型数据库表 这些数据都可以通过Python进行相应的处理,转换成适合Python分析的数据结构,之后用Python...
2013-09-04 12:01:54
What is this book about?
本书主要讨论在Python下如何处理、管理、清除数据,一并介绍了在Python下如何进行科学计算技术。书中还介绍了Python语言和python标准库通过python提供的标准库可以有效的解决您在用Python进行大数据处理。
书中提到的“数据”泛指:
1)矩阵或者说多维数组
2)表格(类似Excel、Calc)
3)诸如SQL关系型数据库表
这些数据都可以通过Python进行相应的处理,转换成适合Python分析的数据结构,之后用Python相应的工具进行数据分析、处理,提出数据特征并用一定的结构形式表现出来,这种形式对习惯用Excel处理数据的用户来说不会陌生,能够接受。
Why Python for data analysis? Python具有很强的魅力,很容易使人很快的喜欢上她!从91年开始Python就成为广受喜爱的动态编程语言(?随提的)Python和Ruby近些年比较火(国内如何?)尤其是Django、Rails等web构架的流行促使更多人学习使用Python和Ruby。 Python和Ruby还有Perl业内常称做脚本语言,他们能够用最短小的代码或脚本完成最优美的功能。作者不太喜欢用脚本语言来界定Python因为脚本语言言外之意是说Python等语言能力...
2013-09-04 12:02:20
Why Python for data analysis?
Python具有很强的魅力,很容易使人很快的喜欢上她!从91年开始Python就成为广受喜爱的动态编程语言(?随提的)Python和Ruby近些年比较火(国内如何?)尤其是Django、Rails等web构架的流行促使更多人学习使用Python和Ruby。
Python和Ruby还有Perl业内常称做脚本语言,他们能够用最短小的代码或脚本完成最优美的功能。作者不太喜欢用脚本语言来界定Python因为脚本语言言外之意是说Python等语言能力单薄无法胜任mission-critical(重要任务?)构建大型软件系统。
近些年无论是工业级应用还是科研Python已被广泛采用。
用Python做大数据分析就不可避免的要和其他开源软件以及R、Matlab等工具进行一下对比,无论是数据分析、计算、可视化,Python都不逊于上述各类软件或工具。
Python as Glue
Python的成功一部分归功于其能很好的集成(支持)C、C++、Fortran语言代码。(Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。)部分程序可以用C或C++编写,然后在Python程序中使用它们。
还是有一些错误的, 现将自己找到的罗列如下: 1. Chap 9 2016 Federal Election 例子中 def get_top_amounts(group, key, n=5): totals = group.groupby(key)['contb_receipt_amt'].sum() # Order totals by key in descending order return totals.order(ascending=False)[-n:] 应该是返回前n个结果, 所以最后一行应为: return totals.order(ascending=False)[:n] 2. pivot table 相关的 parameter 名称都应为 index 和 columns...
2017-07-12 09:42:27
还是有一些错误的, 现将自己找到的罗列如下:
1. Chap 9 2016 Federal Election 例子中
def get_top_amounts(group, key, n=5):
totals = group.groupby(key)['contb_receipt_amt'].sum()
# Order totals by key in descending order
return totals.order(ascending=False)[-n:] 引自 勘误
1 有用 tomsheep 2013-07-05 15:58:25
看文档就可以了
1 有用 水晶核桃 2013-06-28 09:03:35
好像读得囫囵吞枣……
0 有用 Reading 2013-11-23 22:01:05
详尽介绍pandas等lib的API
2 有用 casanova80 2014-04-11 22:24:29
基本上就是pandas的tutorial
1 有用 sevenseas 2015-10-26 03:38:59
pandas真是神烦
0 有用 G2018 2022-03-07 21:37:12
很有工具书的感觉,反正让我静下心来把它当教材一样仔细看我是做不到的,怎么说呢?get bored easily,但是当成pandas查阅资料来看挺OK的。 @2017-12-13 19:28:17
0 有用 hoho 2022-02-09 18:40:56
入门pyhthon用;例子完全没有实际意义,学会了但记不住,学了两遍。。。
0 有用 Kidulty 2022-01-20 02:01:44
pandas numpy重跟了遍
0 有用 Solsiden 2021-09-14 21:35:38
配合 Coursera 的 Data Science 教程学习,适合查漏补缺
0 有用 荒草 2021-06-12 22:49:36
很好的pandas工具书。这种书不适合愣读,必须是在需要用pandas处理data时读才最能学到然后立马运用各种小妙招