豆瓣
扫码直接下载
1flume采集日志到kafka中,spark streaming去处理计算 2spark是加州大学伯克利分校发明的 3spark社区和生态发展越来越好,是未来的趋势。
大杂烩
哎
发现自己对这种工程性读本倦了
Spark是基于内存计算的大数据并行计算框架,因为它基于内存计算,所以提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。Hadoop中包含计算框架MapReduce和分布式文件系统HDFS。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive等分布式存储层,融入Hadoop的生态系统,并弥补MapReduce的不足。
代码凑字数
水
东拼西凑,竟是错误,刚看了14页,发现了4,5处错误,妈的,就知道骗钱
不连续;杂;不适合新手;体现不了实战二字。
有种“对方不想和你说话,并丢出一堆工具给你”的感觉。很多计算模型介绍,而就仅仅介绍,代码应用很浅,随便几行演示那种,也就看看个示例,并没有“实战”可言。
虎头蛇
> Spark大数据分析实战
3 有用 飞翔的虎头鹰 2017-03-09 10:51:21
1flume采集日志到kafka中,spark streaming去处理计算 2spark是加州大学伯克利分校发明的 3spark社区和生态发展越来越好,是未来的趋势。
0 有用 小土刀 2019-05-27 14:22:42
大杂烩
0 有用 Lithium 2019-12-01 14:29:27
哎
0 有用 Vine 2018-02-04 01:32:06
发现自己对这种工程性读本倦了
0 有用 昊天 2020-04-23 16:26:46
Spark是基于内存计算的大数据并行计算框架,因为它基于内存计算,所以提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。Hadoop中包含计算框架MapReduce和分布式文件系统HDFS。 Spark是MapReduce的替代方案,而且兼容HDFS、Hive等分布式存储层,融入Hadoop的生态系统,并弥补MapReduce的不足。
0 有用 CourageCounts 2020-03-02 00:17:50
代码凑字数
0 有用 不欺售欺 2018-12-18 22:05:12
水
0 有用 Ronnie Wang 2018-04-29 08:37:35
东拼西凑,竟是错误,刚看了14页,发现了4,5处错误,妈的,就知道骗钱
0 有用 向十五 2021-02-03 10:57:37
不连续;杂;不适合新手;体现不了实战二字。
0 有用 焦糖豆瓣酱 2021-02-23 16:25:31
有种“对方不想和你说话,并丢出一堆工具给你”的感觉。很多计算模型介绍,而就仅仅介绍,代码应用很浅,随便几行演示那种,也就看看个示例,并没有“实战”可言。
0 有用 joyspan 2017-02-06 10:42:51
虎头蛇