大数据背后的数据销毁动机
本书由大数据专家撰写。 我知道这点,因为我从事数据销毁相关的工作十年了。 现在我读了这本书,我发现我的所有问题都在本书中得到解决。 事实上,所讨论的每个问题都出现在我的管道中,好像作者在我的项目中与我一起工作。另一本对我来说非常有用的功能是它是第一本我可以找到Storm Trident框架的简明解释的书,尽管这本书不是关于Storm的。如果您正在寻找不同处理大数据方法的调查,您需要阅读“量表元素:组合和缩放数据平台”。 本书致力于Lambda Architecture(在上面的文章中进行了调查)。这本书很有条理。第1章的介绍将是整本书的路线图。通过基于RDBMS的简单Web应用程序的激励,作者展示了如何扩展它的方法变得不合需要。在列举了所需属性列表之后,他提出了Lambda架构,这是一种与完全增量架构(使用RDBMS)形成对比的方法。Lambda架构分为三层:
1.批处理层,用于计算大数据的不同视图
2.服务层,使用来自批处理层和速度层的视图来回答用户查询。
3.速度层,在批处理层处理完整答案时,在一段时间内补偿近似答案。
在其余章节中,作者深入探讨了Lambda Architecture所有不同部分的基本原理和要求。
在Lambda Architecture的背景下,也可以参考维基百科的crticism。
每天世界上产生 2.5 quintillion bytes 的数据。研究大数据的时刻,数据安全和销毁就不可避免地引起人们的讨论。
有关键情节透露