出版社: 电子工业出版社
原作名: Head First Data Analysis
译者: 李芳
出版年: 2009
页数: 445
定价: 88.00元
丛书: O'Reilly深入浅出系列
ISBN: 9787121116933
内容简介 · · · · · ·
《深入浅出数据分析》以类似“章回小说”的活泼形式,生动地向读者展现优秀的数据分析人员应知应会的技术:数据分析基本步骤、实验方法、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧;正文以后,意犹未尽地以三篇附录介绍数据分析十大要务、R工具及ToolPak工具,在充分展现目标知识以外,为读者搭建了走向深入研究的桥梁。
本书构思跌宕起伏,行文妙趣横生,无论是职场老手,还是业界新人,无论是字斟句酌,还是信手翻阅,相信都能跟着文字在职场中走上几回,去体味数据分析领域的乐趣与挑战。
作者简介 · · · · · ·
Michael Milton将自己的大半职业生涯献给了非盈利机构,帮助这些机构解析和处理从赞助人那里收集来的数据,提高融资能力。Michael Milton拥有新佛罗里达学院哲学学位及耶鲁大学宗教伦理学学位。多年来,他博览群书,这些书籍虽字字珠玑,却枯燥乏味; 蓦然抬首, 深入浅出(Head First)系列图书让他眼前一亮,他欣然抓住机会,写出了这本同样字字珠玑,兼振奋人心的书。
走出图书馆和书店,人们会看到他在跑步,摄影,以及亲手酿制啤酒。
目录 · · · · · ·
2 实验:检验你的理论 37
3 最优化:寻找最大值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越第一关 169
· · · · · · (更多)
2 实验:检验你的理论 37
3 最优化:寻找最大值 75
4 数据图形化:图形让你更精明 111
5 假设检验:假设并非如此 139
6 贝叶斯统计:穿越第一关 169
7 主观概率:信念数字化 191
8 启发法:凭人类的天性作分析 225
9 直方图:数字的形状 251
10 回归:预测 279
11 误差:合理误差 315
12 相关数据库:你能关联吗? 359
13 整理数据:井然有序 385
附录一 尾声:正文未及的十大要诀 417
附录二 安装R:启动R! 427
附录三 安装Excel分析工具:ToolPak 431
· · · · · · (收起)
豆瓣成员常用的标签(共187个) · · · · · ·
丛书信息
喜欢读"深入浅出数据分析"的人也喜欢 · · · · · ·
书评 · · · · · · (共17条)
我来评论这本书
-
最有用的好评
数据分析的入门极品,... 20/20有用
-
最有用的中差评
-
EDWARD TUFTE是数据图形化的最高权威,他的著作宛如一座奇妙的数据图形化博物馆,数据图形化有时被他称为认知艺术。 数据分析的固定基本流程:确定---分解---评估---决策 你对外界的假设和你确信的观点就是你的心智模型 统计模型取决于心智模型,所以分析的重中之重是明确心智模型,最好使用正确的心智模型。心智模型应当包括你不了解的因素
2011-06-02 10:18
-
印象最深的几点: 1.假设检验那章的用因果网络做定量评估。 通过已知因素排除最不可能的结果,再利用已知因素对剩余的各种结果作定量评价(五个减号到五个加号),求平均得最终结果。这种方法对我很有启发,可以对一些逻辑层面的东西作定量分析。 2.对可能性定量。 很可能,有可能,不可能,非常可能的可能性是:70%,50%,15%,90%等等,这又是一种定量分析的途径。 3.贝叶斯概率,主观概率 俄罗斯石油的案例确实生动地展示了...
2011-10-06 17:34
印象最深的几点:1.假设检验那章的用因果网络做定量评估。通过已知因素排除最不可能的结果,再利用已知因素对剩余的各种结果作定量评价(五个减号到五个加号),求平均得最终结果。这种方法对我很有启发,可以对一些逻辑层面的东西作定量分析。2.对可能性定量。很可能,有可能,不可能,非常可能的可能性是:70%,50%,15%,90%等等,这又是一种定量分析的途径。3.贝叶斯概率,主观概率俄罗斯石油的案例确实生动地展示了主观概率的误导性,不能过分依赖直觉。4.直方图,散点图等简单的图表能直观地展示数据的整体概貌,为深入的分析指引方向。5.平衡预测的解释性和预测性(balance explanation and prediction)explanation 和 prediction两者不可兼得,预测的范围越广,预测的可靠性越低,预测的可靠性越高,预测的范围越小。6.正确的假设基于错误假设的分析会令人误入歧途。 Define=>Disassemble=>Evaluate=>Decide7.检验某个理论一定要有对照组,对照组的选择一定要控制各种非关注因素的干扰。8.启发式分析分析时去除不重要不易观测不易定量的因素,保留可观测的有说服力的因素。9.其他:统计学,Excel技巧,R,可视化,关系数据库,文本处理技能……数据分析之路,路漫漫其修远兮。回应 2011-10-06 17:34 -
Chapter 1 Introduction to data analysis 1. Define by how much do you want to increase sales? how do you think we'll do it?/who should we focus on? how much of a sales increase do you think is feasible? are the target sales figures reasonable? market share? how are our competitors' sales? what's the de...
2012-12-29 13:39
Chapter 1 Introduction to data analysis 1. Define by how much do you want to increase sales? how do you think we'll do it?/who should we focus on? how much of a sales increase do you think is feasible? are the target sales figures reasonable? market share? how are our competitors' sales? what's the deal with the ads and the social networking marketing budget? 2. Disassemble how do we increase sales? what do our best customers want from us? what promotions are most likely to work? how is our advertising doing? * your client's beliefs * your thoughts on the data * ask clients: * where would you say are the biggest gaps in your knowledge about …sales? * how confident are you that advertising has increased sales in the past? * who else might buy the product besides tween girls? 3. Evaluate 4. Decide 5. brief report: concise, professional, and direct! 1. context: your client's beliefs(refer 2.) 2. Interpretation of data: your thoughts on the data (refer 2.) 3. RecommendationChapter 2 Experiments * what could you do to start figuring our how to increase sales? * Interview the CEO to figure out how XXX works as a business * Do a survey of customers to find out what they're thinking * when analyzing surveys, pay attention to confounder * confounder: a difference among the people in your study other than the factor you're trying to compare that ends up making your results less sensible. * How to randomize? * in a spreadsheet, create a column called Random * first cell: =RAND() * same for remaining cells * sort by Random column回应 2012-12-29 13:39
-
左巫右帝 (「人間只是我工作的地方」)
Page 367 & 369的练习直接用R来做了~Excel跑起来太慢 R里面清洗数据更灵活一些 http://www.headfirstlabs.com/books/hfda/hfda_ch12_articles.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_issues.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_articleHitsComments.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_sales.csv articles <- read.csv("http://www.headfirstla...2013-05-17 16:19
Page 367 & 369的练习直接用R来做了~Excel跑起来太慢R里面清洗数据更灵活一些http://www.headfirstlabs.com/books/hfda/hfda_ch12_articles.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_issues.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_articleHitsComments.csv http://www.headfirstlabs.com/books/hfda/hfda_ch12_sales.csvarticles <- read.csv("http://www.headfirstlabs.com/books/hfda/hfda_ch12_articles.csv",header=TRUE) # articleID issueID authorID webHits #1 1 1 8 2019 issues <- read.csv("http://www.headfirstlabs.com/books/hfda/hfda_ch12_issues.csv",header=TRUE) # issueID PubDate #1 1 10/24/04 articleHitsComments <- read.csv("http://www.headfirstlabs.com/books/hfda/hfda_ch12_articleHitsComments.csv",header=TRUE) # articleID authorName webHits commentCount #1 1 Destiny Adams 2019 14 library(sqldf) sqldf("Select issueID, count(articleID) as 'Article count' from articles group by issueID ") # issueID Article count #1 NA 0 #2 1 7 ArticleCount <- sqldf("Select issueID, count(articleID) as 'Article count' from articles group by issueID ") dispatch_analysis <- merge(issues,ArticleCount, by="issueID") sales <- read.csv("http://www.headfirstlabs.com/books/hfda/hfda_ch12_sales.csv",header=TRUE) head(sales) salesSum <- sqldf("Select issueID, sum(lotSize) as 'Article count' from sales group by issueID ") dispatch_analysis <- merge(dispatch_analysis,salesSum, by="issueID")
回应 2013-05-17 16:19
论坛 · · · · · ·
| 英文勘误链接看这里,中文勘误陆续完善 | 来自whoopdown闲人 | 8 回应 | 2012-05-07 |
| 疑似bug的list | 来自大头 | 12 回应 | 2011-08-24 |
| 深入浅出数据分析 样张试读 | 来自互动出版网 | 11 回应 | 2010-11-25 |
| 哪位有中文版的PDF? | 来自Sutrong | 6 回应 | 2013-01-18 |
| head first又一力作 | 来自灵泛的饭钵 | 2010-11-30 |
> 浏览更多话题
这本书的其他版本 · · · · · · ( 全部4 )
- O'Reilly Media版 2009-8-4 / 36人读过 / 有售
- 电子工业出版社版 2012-12 / 3人读过 / 有售
- 歐萊禮,版 2011-4-5 / 1人读过
以下豆列推荐 · · · · · · ( 全部 )
- 推荐给互联网产品经理的书单 (酷拉皮卡)
- 团队分享 (Fenng)
- 数据分析 (夜深沉)
- 心理科学大家-理论普及书 (moomoofarm)
- 商品管理/货品管理/零售业/供应链/数据分析 (W)
谁读这本书?
喜欢这本书的人常去的小组 · · · · · ·

- 数据挖掘 (7527)

- 数据分析统计推断 (627)

- 要有光 (1880)

- IT产品经理 (9122)

- 互联网产品经理 (6267)

- NoSQL (1480)

- Pmcaff 产品经理沙龙 (2648)

- 用户行为分析 (7196)
二手市场
订阅关于深入浅出数据分析的评论:
feed: rss 2.0













夜深沉 (存上等心·结中等缘·享下等福)
2013-01-01 19:50
左巫右帝 (「人間只是我工作的地方」)
2013-05-17 16:19
左巫右帝 (「人間只是我工作的地方」)
2013-05-17 14:03
LANTzhang (我是怕死鬼,怕死,又怕鬼。)
2013-05-16 23:31