豆瓣
扫码直接下载
目前看到的最全面最有用的讲解spark的书籍
spark开发进阶书。讲述了常用的transform action函数优化方法,针对大数据下数据倾斜,导致oom的场景,讲述了优化方法。高效的算法往往不是最简洁的。
翻译垃圾,纯机器翻译。内容也一般,没讲什么东西
前面4章认真看了一下, 感觉比较浅的。 不知道是不是时代的原因, 这个书里面的内容已经过时了? 5-8章 简略看了一下。 5 主要说了transform的一些东西,6 是说 kv 数据处理。 7章说了用别的语言是怎么和spark交互然后还有一些优缺点之类的。 第八章是测试, 第九章讲得ml啥的, 跳过。 这个主要的问题我感觉是工作主要是用sql的api, 这个RDD 是不是很少用呢?
进阶提升,查漏补缺
觉得比Spark权威指南稍差一点,第六章的goldilocks的例子不错。
在书没有正式出版前,就阅读了该书的初稿。这是一本非常不错的Spark进阶书籍。该书主要涉及spark-core和spark-sql两部分,主要从性能的角度去分析Spark的功能及使用。该书篇幅不多,没有像国内很多Spark书籍大段大段贴源码的情况。
确实牛逼
吃透那几个例子对spark理解算是非常深入了。
书真不错可惜国内引进有点晚,期待下一版能有更多关于dateframe/dataset的内容
简略
> High Performance Spark
1 有用 Gabriel Fu 2018-08-09 13:40:24
目前看到的最全面最有用的讲解spark的书籍
2 有用 WeiLu 2017-10-15 16:41:38
spark开发进阶书。讲述了常用的transform action函数优化方法,针对大数据下数据倾斜,导致oom的场景,讲述了优化方法。高效的算法往往不是最简洁的。
0 有用 我霸天君不服 2023-05-17 00:42:08 四川
翻译垃圾,纯机器翻译。内容也一般,没讲什么东西
0 有用 3点一直线 2023-03-24 10:14:55 美国
前面4章认真看了一下, 感觉比较浅的。 不知道是不是时代的原因, 这个书里面的内容已经过时了? 5-8章 简略看了一下。 5 主要说了transform的一些东西,6 是说 kv 数据处理。 7章说了用别的语言是怎么和spark交互然后还有一些优缺点之类的。 第八章是测试, 第九章讲得ml啥的, 跳过。 这个主要的问题我感觉是工作主要是用sql的api, 这个RDD 是不是很少用呢?
0 有用 冰镇绿豆汤 2019-06-14 21:39:38
进阶提升,查漏补缺
0 有用 darcy27149 2020-04-15 22:59:12
觉得比Spark权威指南稍差一点,第六章的goldilocks的例子不错。
2 有用 核动力蜗牛 2017-03-13 17:35:48
在书没有正式出版前,就阅读了该书的初稿。这是一本非常不错的Spark进阶书籍。该书主要涉及spark-core和spark-sql两部分,主要从性能的角度去分析Spark的功能及使用。该书篇幅不多,没有像国内很多Spark书籍大段大段贴源码的情况。
0 有用 眼霜 2019-08-23 19:23:23
确实牛逼
0 有用 阿凡达弟弟 2022-05-31 11:34:33
吃透那几个例子对spark理解算是非常深入了。
0 有用 再给我三刀 2019-07-12 10:34:51
书真不错可惜国内引进有点晚,期待下一版能有更多关于dateframe/dataset的内容
0 有用 不会飞的超人 2019-10-12 00:18:05
简略