豆瓣
扫码直接下载
关于围绕数据的infra生态介绍的最全面的一本书,其中最有启发的是metadata治理这一块,metadata管理可以管控上下游数据的schema,可以配置warehouse schema版本变动,也可以提供数据质量检测,pipeline活动的监控,目前看这些也没有通用的标准,但应该是核心需求
云数据平台介绍指南,通俗易懂,学习到了许多
3.5, lagging behind the real world
概要,信息量不多。
半个月时间草草翻阅一遍,最有用的是将数据处理分成6层,每次之间相互解耦,不通的组合带来了极大的灵活性。不仅仅对于使用云平台,对于自研大数据平台,也提供了指导意见。还需要细细每个Layer再读+实践。Who should read this book?我觉得不管是数据产品经理、大数据平台工程师、数仓工程师都可以读读。
> Designing Cloud Data Platforms
2 有用 heisen 2022-02-17 10:19:11
关于围绕数据的infra生态介绍的最全面的一本书,其中最有启发的是metadata治理这一块,metadata管理可以管控上下游数据的schema,可以配置warehouse schema版本变动,也可以提供数据质量检测,pipeline活动的监控,目前看这些也没有通用的标准,但应该是核心需求
0 有用 清玩 2022-02-25 15:14:03
云数据平台介绍指南,通俗易懂,学习到了许多
0 有用 bitstring 2024-09-07 21:46:47 上海
3.5, lagging behind the real world
0 有用 差不多先生 2023-01-30 18:08:40 湖南
概要,信息量不多。
0 有用 compaqFan 2022-06-13 14:07:41
半个月时间草草翻阅一遍,最有用的是将数据处理分成6层,每次之间相互解耦,不通的组合带来了极大的灵活性。不仅仅对于使用云平台,对于自研大数据平台,也提供了指导意见。还需要细细每个Layer再读+实践。Who should read this book?我觉得不管是数据产品经理、大数据平台工程师、数仓工程师都可以读读。