《Hadoop安全》试读:前言
虽然Apache Hadoop 仍然是一个相对较新的技术,但这并没有限制它迅速地被业界采用,并爆发式地出现了很多相关工具,正是这些工具组成了Hadoop 广阔的生态系统。对于Hadoop 用户,这当然是个令人振奋的时代。Hadoop 给公司带来了前所未有的增值机会,同时也给负责数据访问安全和系统合规的技术人员带来了很多挑战。目前,已经有丰富的信息能够帮助使用Hadoop 构建解决方案的开发者,以及部署运维Hadoop 的管理员。然而,关于如何设计和实现Hadoop 安全部署的指导信息依然匮乏。
本书全面而深入地介绍了Hadoop 的众多安全特性,并使用通用的计算机安全概念进行组织。第1 章是介绍性内容,随后分为4 大部分:第一部分是安全架构,第二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。这些部分涵盖了从设计安全架构的前期步骤,到实现通用的安全访问控制和数据保护。最后介绍了几个用例,融合了书中的很多概念。
目标读者
本书的目标人群是管理大数据平台安全的Hadoop 管理员,以及需要在大型企业架构中设计集成Hadoop 安全规划的安全架构师。书中介绍了很多Hadoop 安全概念,包括验证、授权、审计、加密和系统架构。
第1 章是对贯穿全书的一些安全概念的综述,以及对Hadoop 生态系统的简介。如果刚刚接触Hadoop,建议你阅读《Hadoop 技术详解》和《Hadoop 权威指南》。本书假设读者熟悉Linux、计算机网络以及一般的系统架构知识。对于那些在保护分布式系统安全方面没有经验的管理员,第2 章会给出这部分内容的概述。有经验的安全架构师如果不想回顾这方面知识,可以跳过这一章。总体而言,本书不要求读者具备编程背景,而尽量将内容重点集中于Hadoop 安全在架构和操作方面的实现。
排版约定
本书使用以下排版约定。
• 楷体
表示新术语和重点强调的内容。
• 等宽字体(constant width)
表示程序片段,以及正文中出现的变量、函数名、数据库、数据类型、环境变量、语句和关键词等。
• 加粗等宽字体(constant width bold)
表示命令以及其他需要用户输入的文字。
• 等宽斜体(constant width italic)
表示这些值应该替换为用户输入,或根据上下文确定。
该图标表示提示或建议。
该图标表示一般性说明。
该图标表示警告或警示。
使用代码示例
我们在全书提供了配置文件,用以指导读者为自己的Hadoop 环境进行安全防护。这些样例中, 可供下载的版本链接为:https://github.com/hadoop-security/examples。在第13章,本书提供了设计、实现和部署一个保存网页快照的网络接口的完整样例。该样例的完整源代码以及关于可部署应用的Hadoop 集群的安全配置说明,都可以在GitHub 上下载(https://github.com/hadoop-security/kite-spring-hbase-example)。
本书旨在帮助读者完成自己的工作。通常情况下,如果书中包含代码样例,你可以在自己的程序和文档中使用它们,不需要联系我们申请授权,除非需要直接复制相当一部分的代码。例如,编写程序时,使用本书中的几个代码片段并不需要申请授权,但出售或分发O’Reilly 图书代码样例的光盘则需要获得许可;引用本书或引用样例解答问题不需要授权,但将本书的大量样例代码纳入产品的文档则需要获得许可。
我们不强制要求你在引用本书内容时进行声明,但如果你这么做,我们会非常感激。引用信息通常包括书名、作者、出版社和ISBN,如:Hadoop Security by Ben Spivey and JoeyEcheverria (O’Reilly). Copyright 2015 Ben Spivey and Joey Echeverria, 978-1-491-900 98-7。若你认为对样例代码的使用需要授权,请通过这个邮箱联系我们:permissions@oreilly.com。
Safari® Books Online
Safari Books Online 是应运而生的数字图书馆,它同时以图书和视频的形式出版世界顶级技术和商业作家的专业作品。
技术专家、软件开发人员、Web 设计师、商务人士和创新专家等,都将Safari Books Online 作为开展调研、解决问题、学习和认证培训的首选资源。
Safari Books Online 为企业、政府、教育和个人提供各种产品组合和灵活的定价策略。会员可以通过搜索,从数据库中访问数以千计的图书、培训视频和正式出版前的书稿,这些数据来源包括O’Reilly Media、Prentice Hall Professional、Addison-Wesley Professional、Microsoft Press、Sams、Que、Peachpit Press、Focal Press、Cisco Press、John Wiley & Sons、Syngress、Morgan Kaufmann、IBM Redbooks、Packt、Adobe Press、FT Press、Apress、Manning、New Riders、McGraw-Hill、Jones & Bartlett、Course Technology 等。要了解SafariBooks Online 的更多信息,请访问我们的网站(http://www.safaribooksonline.com/)。
联系我们
请把对本书的评价和问题发给出版社。
美国:
O’Reilly Media, Inc.
1005 Gravenstein Highway North
Sebastopol, CA 95472
中国:
北京市西城区西直门南大街2 号成铭大厦C 座807 室(100035)
奥莱利技术咨询(北京)有限公司
我们为本书提供了专门网页,上面有勘误表、示例以及其他信息。可以通过http://bit.ly/hadoop-security 访问该网页。本书中文版勘误可到http://www.ituring.com.cn/book/1600 提交。
为本书提供建议或咨询技术问题,请发邮件到bookquestions@oreilly.com。
想了解更多关于O’Reilly 图书、培训课程、会议和新闻的信息,请访问以下网站:http://www.oreilly.com。
我们的其他联系方式如下:Facebook:http://facebook.com/oreilly
Twitter:http://twitter.com/oreillymedia
YouTube:http://www.youtube.com/oreillymedia
致谢
Ben 和Joey 要感谢以下所有人:编辑Marie Beaugureau 和所有O’Reilly 公司的工作人员;Ann Spencer;贡献了友情客串章节的Eddie Garcia;主要技术审阅者Patrick Angeles、Brian Burton、Sean Busbey、Mubashir Kazia 和Alex Moundalexis;Jarek Jarcec Cecho;提供宝贵意见的其他作者Eric Sammer、Lars George 和Tom White;还有为我们提供集体支持的Cloudera 的伙伴们,本书在他们的帮助下才得以问世。
来自Joey的致谢
我想将此书献给Maria Antonia Fernandez、Jose Fernandez 和Sarah Echeverria,他们在此前的每个日子里都鼓舞着我,让我觉得自己能完成想要完成的任何事情。我还要感谢我的父母Maria 和Fred Echeverria,我的兄弟姐妹Fred、Marietta、Angeline、Paul Echeverria 和Victoria Schandevel,他们始终给我爱与支持。此外,若是没有Apache Hadoop 社区难以置信的强大支持,我无法完成本书。这里我无法列出帮助我们的每个人,不过Ben 在后面列出了一些——当然不是全部。最后,我想感谢我的合著者Ben:我们共同完成了一件了不起的事情,Bennie(Paul,别客气)。
来自Ben的致谢
我想以此书纪念Ginny Venable 和Rob Trosinski,我深深地怀念他们。我想感谢妻子Theresa,是你给予我无限支持和理解,以及始终让我微笑的Oliver Morton。感谢我的父母Rich 和Linda,谢谢你们长期以来向我展示教育的价值,并以卓越的专业才能树立了榜样。感谢Matt、Jess、Noah,以及Spivey 家庭的其他成员,感谢Mary、Jarrod 和DollyTrosinsk,感谢Swope 一家,以及整个过程中给予我极大帮助的朋友们:Hemal Kanani(BOOM)、Ted Malaska、Eric Driscoll、Paul Beduhn、Kari Neidigh、Jeremy Beard、JeffShmain、Marlo Carrillo、Joe Prosser、Jeff Holoman、Kevin O’Dell、Jean-Marc Spaggiari、Madhu Ganta、Linden Hillenbrand、Adam Smieszny、Benjamin Vera-Tudela、PrashantSharma、Sekou Mckissick、Melissa Hueman、Adam Taylor、Kaufman Ng、Steve Ross、Prateek Rungta、Steve Totman、Ryan Blue、Susan Greslik、Todd Grayson、Woody Christy、Vini Varadharajan、Prasad Mujumdar、Aaron Myers、Phil Langdale、Phil Zeyliger、BrockNoland、Michael Ridley、Ryan Geno、Brian Schrameck、Michael Katzenellenbogen、DonBrown、Barry Hurry、Skip Smith、Sarah Stanger、Jason Hogue、Joe Wilcox、Allen Hsiao、Jason Trost、Greg Bednarski、Ray Scott、Mike Wilson、Doug Gardner、Peter Guerra、Josh Sullivan、Christine Mallick、Rick Whitford、Kurt Lorenz、Jason Nowlin 和ChuckWigelsworth。最后,我要感谢Joey,还好他帮我一起写了这本书——我从不认为能够独自完成本书。如果我由于疏忽忘记了一些朋友,请接受我最诚挚的歉意。
来自Eddie的致谢
我想感谢我的家人和朋友,他们在我第一本书的写作历程中给予了支持和鼓励。Sandra、Kassy、Sammy、Ally、Ben、Joey、Mark 和Peter,谢谢你们。
免责声明
感谢你阅读本书。虽然笔者试图对Hadoop 生态系统的不同安全特性进行解释、文档化并给出建议,但这并不表明或暗示,使用这些特性中的任何一个将获得完全安全的集群。从安全角度来说,无论使用什么保护机制,任何信息系统都不是100% 安全的。我们鼓励对Hadoop 环境进行持续的安全检查,从而确保可能达到的最好的安全状态。对于可能由于使用本书中任何特性所造成的损坏,笔者、O’Reilly 公司及人民邮电出版社不对此负责。所有操作,风险自负。
电子书
扫描如下二维码,可购买本书电子版。

