内容简介 · · · · · ·
本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。.
本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:
使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..
熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理
洞悉编写MapReduce实际应用程序时常见陷阱和高级特性
设计、构建和管理专用的Hadoop集群或在云上运行Hadoop
使用Pig这种高级的查询语言来处理大规模...
本书是您纵情享用数据之美的得力助手。作为处理海量数据集的理想工具,Apache Hadoop架构是MapReduce算法的一种开源应用,是Google(谷歌)开创其帝国的重要基石。本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。.
本书完全通过案例学习来展示如何用Hadoop解决特殊问题,它将帮助您:
使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集运行分布式计算..
熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理
洞悉编写MapReduce实际应用程序时常见陷阱和高级特性
设计、构建和管理专用的Hadoop集群或在云上运行Hadoop
使用Pig这种高级的查询语言来处理大规模数据
利用HBase这个Hadoop数据库来处理结构化和半结构化数据
学习Zookeeper,这是一个用于构建分布式系统的协作原语工具箱
如果您拥有海量数据,无论是GB级还是PB级,Hadoop都是完美的选择。本书是这方面最全面的参考。
原文摘录 · · · · · · ( 全部 )
-
* The architecture of HDFS is described in “The Hadoop Distributed File System” by Konstantin Shvachko, Hairong Kuang, Sanjay Radia, and Robert Chansler (Proceedings of MSST2010, May 2010, http:// storageconference.org/2010/Papers/MSST/Shvachko.pdf). † “Scaling Hadoop to 4000 nodes at Yahoo!,” http://developer.yahoo.net/blogs/hadoop/2008/09/scaling_hadoop _to_4000_nodes_a.html. (查看原文) —— 引自第41页 -
在许多情况下,可以视Mapreduce为关系型数据库管理系统的补充。MapReduce比较适合以批处理的方式处理需要分析整个数据集的问题,尤其是即席分析。RDBMS适用于点查询和更新,数据集被索引后,数据库系统能够提供低延迟的数据检索和快速的少量数据更新。MapReduce适合数据一次写入、多次读取的应用,而关系型数据库更适合持续更新数据集. (查看原文) —— 引自第1页
> 全部原文摘录
丛书信息
· · · · · ·
喜欢读"Hadoop权威指南(中文版)"的人也喜欢的电子书 · · · · · ·
喜欢读"Hadoop权威指南(中文版)"的人也喜欢 · · · · · ·
-
- HBase 8.5
-
- 大规模Web服务开发技术 8.0
-
- 机器学习 8.3
-
- 深入理解Nginx 8.4
-
- Python高级编程 7.6
-
- ZooKeeper 7.9
-
- 集体智慧编程 9.0
-
- 操作系统设计与实现(下册) 8.4
-
- Docker开发实践 7.3
Hadoop权威指南(中文版)的书评 · · · · · · ( 全部 37 条 )
![](https://img1.doubanio.com/icon/user_normal.jpg)
![](https://img9.doubanio.com/icon/u47460982-4.jpg)
对Hadoop的简单了解
![](https://img2.doubanio.com/icon/u1156595-21.jpg)
![](https://img3.doubanio.com/icon/u34113723-3.jpg)
> 更多书评 37篇
论坛 · · · · · ·
hadoop集群服务器,公网ip,免费给大家使用 | 来自sophist wu | 2013-04-28 21:09:52 | |
怎么说呢,作者还是很努力的 | 来自Patrick | 2010-09-18 19:07:20 | |
我读的是英文电子版 | 来自可乐 | 2010-08-04 17:33:26 | |
中国式翻译 | 来自不想长胖 | 2010-07-15 23:46:04 | |
想看呀 | 来自Jim | 2010-06-22 14:26:20 |
> 浏览更多话题
这本书的其他版本 · · · · · · ( 全部11 )
-
O'Reilly Media, Inc. (2009)8.3分 286人读过
-
清华大学出版社 (2011)7.7分 277人读过
-
清华大学出版社 (2017)7.7分 161人读过
-
O'Reilly Media (2012)8.7分 113人读过
在哪儿借这本书 · · · · · ·
以下书单推荐 · · · · · · ( 全部 )
- O'Reilly 之动物书 (leafduo)
- 数据挖掘参考书 (cruyff)
- 已购图书 (小树天天如初见)
- IT 二级基础 分布式系统工程(智力层次-实用性) 1.1.1.9 (ajian005)
- #码农基本功 (是也者乎)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
订阅关于Hadoop权威指南(中文版)的评论:
feed: rss 2.0
0 有用 阅微草堂 2016-10-28 22:30:29
mapreduce,数据库,并发编程
0 有用 砂之器 2018-08-11 15:36:47
2018-54
0 有用 simple 2010-10-15 10:07:40
内容应该给四星半,但是翻译以及排版上的错误百出啊
0 有用 01 2013-10-26 18:26:36
入门
1 有用 厚积薄发 2012-10-13 19:32:32
我觉得这本书的翻译没有那么烂,对比着看英文和翻译过来的,几本都是OK的。作为hadoop的入门书,个人觉得很值得看。其讲述hadoop的mapreduce过程清晰易懂。
0 有用 dqw 2021-01-27 18:01:16
大概过了一遍,内容比较老
0 有用 卡卡君暴起伤人 2020-07-23 09:16:02
转行快乐,再也不会去碰hadoop+spark这套了
1 有用 Belle Wong 2019-04-08 17:20:44
没有牛逼的技术,就没有牛逼的money,一个北漂女也要让自己牛起来!自己一个人奋斗为了虚无缥缈的未来…
0 有用 magicgeo 2019-01-19 16:11:27
一般般
0 有用 supersouth 2018-12-08 20:54:58
hadoop看着一本跟着实践就够了