出版社: 中国电力出版社
译者: 张岩峰 / 王方京
出版年: 2020-4-1
页数: 552
定价: 128.00元
装帧: 平装
ISBN: 9787519840099
内容简介 · · · · · ·
·大数据技术和Spark概述。
·通过实例学习DataFrame、SQL、Dataset等Spark的核心API。
·了解Spark的低级API实现,包括RDD以及SQL和DataFrame的执行过程。
·了解Spark如何在集群上运行。
·Spark集群和应用程序的调试、监控、和调优。
·学习Spark强大的流处理引擎——结构化流处理。
·学习MLlib并了解如何应用它解决包括分类、推荐,以及其他多种实际问题。
作者简介 · · · · · ·
Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。
Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。
译者介绍
...
Bill Chambers是Databricks的一名产品经理,致力于使用Spark和Databricks帮助客户完成大规模数据分析的任务。Bill还定期写关于数据科学和大数据方面的博客, 并常在各种会议和见面会上展示产品。他拥有加州大学伯克利分校信息学院的信息系统硕士学位, 研究方向为数据科学。
Matei Zaharia是斯坦福大学计算机科学系助理教授和Databricks的首席技术官。他于2009年在加州大学伯克利分校创立了Spark项目, 那时他是一名博士生, 并继续担任Apache Spark项目的副主席。Matei Zaharia还是Apache Mesos项目的联合创始人,也是Apache Hadoop项目的贡献者。Matei Zaharia以他出色的研究工作获得了2014年美国计算机学会博士论文奖和VMware系统研究奖。
译者介绍
张岩峰,东北大学教授,在国内外从事大数据分布式处理研究工作10余年,中国计算机学会数据库专委会委员,大数据专委会通讯委员,研究设计了iMapReduce、Maiter等大数据迭代计算分布式框架,承担和参与国家自然科学基金、国家重点研发计划等多项课题,在SIGMOD、VLDB、ICDE、PPoPP、TPDS、TKDE等顶D级国际会议和期刊上发表论文10余篇,曾获云计算国际会议ACM SOCC 2011优秀论文奖及多项国内外奖励和荣誉。
喜欢读"Spark权威指南"的人也喜欢的电子书 · · · · · ·
喜欢读"Spark权威指南"的人也喜欢 · · · · · ·
Spark权威指南的话题 · · · · · · ( 全部 条 )



Spark权威指南的书评 · · · · · · ( 全部 3 条 )

符合《Spark权威指南》的定义
这篇书评可能有关键情节透露
优点: 首先,本书正式出版2018.2月份,对比《hadoop权威指南》,都是性能调优没有讲的很深入,但是都提到了,数据倾斜,null问题,external shuffle service,dynamic allocation,甚至在spark程序中怎么根据log调试jvm内存等等基本上都提到了,包括DataFrame vs DataSet vs R... (展开)
内容上乘,翻译中规中矩
> 更多书评 3篇
读书笔记 · · · · · ·
我来写笔记这本书的其他版本 · · · · · · ( 全部3 )
-
O'Reilly Media (2017)8.3分 65人读过
-
东南大学出版社 (2018)暂无评分 4人读过
-
暂时无货, 8天前曾上架
以下书单推荐 · · · · · · ( 全部 )
谁读这本书?
二手市场
订阅关于Spark权威指南的评论:
feed: rss 2.0
0 有用 Lithium 2020-06-28
讲真的,看了这么久,能读完都靠信仰……看看官方文档就够了
0 有用 adam 2020-07-24
spark2.x易用性提高不少
1 有用 浴火重生 2020-07-05
主要讲api的使用,对于原理方面讲得很浅,而且翻译得很生硬,很多术语都没有采用业界用语,读起来非常不流畅,而且英文原版是彩色的,中文变成了黑白印刷,一些图示都分辨不清楚了
2 有用 Trhflybingo 2020-07-15
买亏了,就是api介绍
0 有用 ZackFairT 2020-06-27
结构化API 与 SQL 应是大数据处理引擎的趋势。大数据现在愈发向传统数据库里的概念靠拢
0 有用 skyPlayer 2021-03-01
看到第20页,撇开翻译质量本身不说,把集群印成群集,spark-submit印成park-submit,没有感觉到出版社的诚意
0 有用 adam 2020-07-24
spark2.x易用性提高不少
2 有用 Trhflybingo 2020-07-15
买亏了,就是api介绍
1 有用 浴火重生 2020-07-05
主要讲api的使用,对于原理方面讲得很浅,而且翻译得很生硬,很多术语都没有采用业界用语,读起来非常不流畅,而且英文原版是彩色的,中文变成了黑白印刷,一些图示都分辨不清楚了
0 有用 Lithium 2020-06-28
讲真的,看了这么久,能读完都靠信仰……看看官方文档就够了