《Hadoop安全》试读
序
近来,“Hadoop 安全”成为了一个充满矛盾的名词。雅虎和Facebook 等公司创建和使用的这个大数据平台的早期版本,在保护其存储的数据方面并没有花费太多精力。实际上也没有必要这么做,因为Hadoop 里几乎没有什么敏感数据,只有对黑客毫无吸引力的状态更新和新闻报道。而且,找到它们也不需要花费很多精力。 然而,当这种平台被更多传统企业使用时,便开始涉及更多传统企业数据。.. (更多)
前言
虽然Apache Hadoop 仍然是一个相对较新的技术,但这并没有限制它迅速地被业界采用,并爆发式地出现了很多相关工具,正是这些工具组成了Hadoop 广阔的生态系统。对于Hadoop 用户,这当然是个令人振奋的时代。Hadoop 给公司带来了前所未有的增值机会,同时也给负责数据访问安全和系统合规的技术人员带来了很多挑战。目前,已经有丰富的信息能够帮助使用Hadoop 构建解决方案的开发者,以... (更多)
第1 章 引言
早在2003 年,谷歌就发表了一篇论文(http://research.google.com/archive/gfs.html),阐述了基于服务器集群的、面向海量数据存储的可扩展系统架构,该架构称为谷歌文件系统(GFS)。一年后,谷歌发表了另一篇论文(http://research.google.com/archive/mapreduce.html),阐述了一个名为MapReduce 的编程模型。该模型利用GFS 并行处理数据,实现了处理程序在数据存储处的本地化运行。几...