内容简介 · · · · · ·
本书是从理论到实践的全面且细致的企业数据驱动指南,从作者的百度大数据工作说起,完整还原其从零到一构建百度用户行为大数据处理平台经历。详解大数据本质、理念与现状,围绕数据驱动四环节——采集、建模、分析、指标,深入浅出地讲述企业如何将数据驱动方案落地,并指出数据驱动的价值在于“数据驱动决策”、“数据驱动产品智能”。最后通过互联网金融、电子商务、企业服务、零售四大行业实践,从需求梳理、事件指标设计、数据接入阶段、实际应用四大阶段介绍数据驱动在不同领域的商业价值,全面展示大数据在各领域内的应用情况与趋势展望。
本书贴近企业真实场景,兼具权威性与前瞻性,是广泛适用的普及读物,适合对大数据、数据驱动感兴趣的企业高管、决策者、创业者、IT人员、营销人员、产品经理、相关专业的学生等。
数据驱动:从方法到实践的创作者
· · · · · ·
-
桑文锋 作者
作者简介 · · · · · ·
桑文锋,神策数据创始人兼CEO,浙江大学计算机科学与技术专业硕士,在百度任职8年,从无到有构建了百度用户日志大数据平台,覆盖数据收集、传输、元数据管理、作业流调度、海量数据查询引擎及数据可视化等。历任软件工程师、高级软件工程师、项目经理、高级项目经理、技术经理,2015年4月离职创建神策数据,针对企业客户推出用户行为分析产品——神策分析,帮助企业实现数据驱动。2017年7月,桑文锋荣获第六届中国财经峰会“2017最佳青年榜样”荣誉。
此外,神策数据联合创始人兼CTO曹犟,神策数据联合创始人兼首席架构师付力力,神策数据资深算法工程师邹雨晗,神策数据架构师房东雨,神策数据算法工程师韩越,神策数据数据分析总监陈新祥,神策数据用户行为洞察研究院负责人张乔,以及神策数据分析师高娜、薛创宇、李金霞、朱静芸均参与了此书的写作。
目录 · · · · · ·
百度数据板块:网页数据和用户行为数据 / 3
搜索引擎发展 / 4
用户行为分析践行:百度知道的回答量提升 7.5% / 5
从零到一构建百度大数据分析平台 / 6
数据源与 Event 模型的重要性 / 9
· · · · · · (更多)
百度数据板块:网页数据和用户行为数据 / 3
搜索引擎发展 / 4
用户行为分析践行:百度知道的回答量提升 7.5% / 5
从零到一构建百度大数据分析平台 / 6
数据源与 Event 模型的重要性 / 9
大数据是屠龙术 / 10
第2章 大数据思维与数据驱动 / 11
大数据的概念 / 14
大数据之“大” / 14
大数据之“全” / 15
大数据之“细” / 16
大数据之“时” / 16
大数据的本质 / 17
数据驱动理念与现状 / 20
数据驱动的价值 / 20
企业内部数据驱动现状 / 21
理想的数据驱动 —— “流” / 23
大数据时代到来的条件 / 24
数据采集能力增强 / 25
数据处理能力增强 / 26
数据意识的提升 / 27
第3章 数据驱动的环节 / 29
数据采集与埋点 / 32
数据采集的现状 / 32
数据采集遵循法则 / 34
科学的数据采集和埋点方式 / 36
数据的准确性 / 40
数据建模 / 44
数据模型与建模 / 44
多维数据模型 / 46
多维事件模型 / 49
多维事件模型的探索经历 / 52
数据分析方法 / 55
行为事件分析 / 55
漏斗分析 / 58
留存分析 / 61
分布分析 / 64
点击分析 / 67
用户路径 / 73
用户分群 / 75
属性分析 / 80
指标体系构建 / 82
第一关键指标法 / 82
海盗指标法 / 86
第4章 数据驱动产品和运营决策 / 89
数据驱动运营监控 / 91
用户获取(Acquisition) / 91
激活(Activation) / 92
留存(Retention) / 97
引荐(Referral) / 99
营收(Revenue) / 101
数据驱动产品改进和体验优化 / 102
数据驱动商业决策 / 104
数据驱动落地企业,要从管理者做起 / 106
数据驱动商业决策的价值 / 108
第5章 数据驱动产品智能 / 109
数据平台及用户智能 / 114
如何计算热门榜单 / 114
客服系统中的行为数据 / 114
为什么需要数据平台 / 115
数据平台提供的能力 / 116
数据应用与用户智能 / 119
基于用户行为数据的用户智能应用 / 119
用户智能分类:基于规则与机器学习 / 123
用户智能应用——用户画像 / 132
两种用户画像:User Persona与User Profile / 132
用户画像(User Profile)标签体系的建立 / 135
用户智能应用——个性化推荐 / 139
个性化推荐的概念 / 139
架构实现 / 140
数据流 / 142
业务分析与模型选择 / 143
实验与迭代 / 144
第6章 各行业实践数据分析全过程 / 147
互联网金融数据驱动实践 / 149
实践案例 / 150
企业服务数据驱动实践 / 158
数据驱动能够为企业服务做什么 / 159
面临的挑战 / 160
数据应用的阶段 / 161
实践案例 / 168
零售行业数据驱动实践 / 175
实践案例 / 176
电子商务数据驱动实践 / 186
打破企业发展经营困局:从粗放式到精细化 / 186
电商企业数据驱动瓶颈 / 187
实践案例 / 187
写在最后的话 / 197
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
-
“大数据的本质是消除不确定性”,我第一次接触这个观点是在吴军的《硅谷之谜》一书中,当时觉得醍醐灌顶,我一直在思考究竟什么是大数据?而吴军的这句话直中要害。之后我在看《暗时间》一书时,尝试搜索信息论和不确定性的关系,发现克劳德·香农(Claude Shannon)说了这么一句话:“信息是用来消除不确定性的东西”。 (查看原文) —— 引自章节:第2章 大数据思维与数据驱动 / 11 -
“细” 要求把不同的维度都采集下来。对于用户行为事件来说,我们要采集Who、When、Where、How、What 等信息,完成每一个事件的维度/属性/字段的采集,对事件的发生形成一个快照。若数据采集只是按照需求采集,在后续数据分析时不断遇到新需求,则又要采集新的数据,如此会延长整个迭代周期,导致效率低下。 (查看原文) —— 引自章节:第2章 大数据思维与数据驱动 / 11
> 全部原文摘录
喜欢读"数据驱动:从方法到实践"的人也喜欢的电子书 · · · · · ·
喜欢读"数据驱动:从方法到实践"的人也喜欢 · · · · · ·
数据驱动:从方法到实践的书评 · · · · · · ( 全部 10 条 )

在不同的阶段关注不同的指标


《数据驱动》Back to basic
这篇书评可能有关键情节透露
微信公众号:人力资源转型与复盘笔记 01写在前面 前阵子读的一本小书,有点因为项目的原因想要回过头来看看在底层可行的驱动因子和方法可以有哪些,恰好吃到了这一本,所谓的磨刀不误砍柴工,功不唐捐的找链接的小dots. 02#数据驱动-从方法到实践# 数据金字塔:消息-》信息-》... (展开)
太对我胃口了,我还做了思维导图!《数据驱动》
这篇书评可能有关键情节透露
新时代的生产工具,作者正好是第一批中国大数据的见证和实践者,对我帮助很大。 作者2007年作为一名百度搜索新产品的百度知道研发团队 在工作中给自己设立了目标:在百度公司内,我要让大数据团队发展成为一支与自然语言处理团队同样地位的团队。 难点:人才储备、数据源、数据... (展开)
一本有理论有实践的书

读书笔记-数据驱动:从方法到实践
这篇书评可能有关键情节透露
DT时代,做产品需有数据意识,决定产品迭代方向。最常用的,A/Btest,就是用数据说话。本书侧重基础讲解,对于如何进行数据分析、埋点、建立产品北极星指标、以及辅助产品运营、商业决策、建立用户画像标签,可获得入门理解。 大数据的本质是消除不确定性 埋点 全埋点,无埋点... (展开)> 更多书评 10篇
论坛 · · · · · ·
在这本书的论坛里发言以下书单推荐 · · · · · · ( 全部 )
- 工作后购书目录 (张小国)
- 行为设计学书单 (大辉)
- 神策数据桑文锋的数据分析师豆列 (Welf)
- 书单|数据分析 (锦杰)
- 书单|大数据 (张宗昌)
谁读这本书? · · · · · ·
二手市场
· · · · · ·
- 在豆瓣转让 有627人想读,手里有一本闲着?
订阅关于数据驱动:从方法到实践的评论:
feed: rss 2.0
0 有用 闪oo电侠 2021-12-27 08:30:17
驱动决策并非充分发挥大数据的全部价值,让产品智能化更代表行业的发展方向
0 有用 逐日 2022-03-14 19:29:52
广告书
0 有用 三米 2022-08-15 15:56:09
有些书作者是炫技,有些书作者是希望你有所收获,这本书无疑是后者
0 有用 Soo Yung 2020-02-25 13:38:34
桑总写的真是深入浅出,除了技术指导以外,宏观上看到很多商业分析的方法论,佩服。1数据(离散元素)-信息(连接元素)-知识(组织信息)-智慧(应用知识)。2数据驱动=驱动据测(产品改进、运营优化、营销分析、商业决策)+产品智能(数据基础+算法模型+形成反馈)。3数据驱动的流=数据接入-实时/批量传输-建模/存储-统计/分析/挖掘-可视化/反馈。4大数据=宏观大量+全面数据源+不同维度细致+时效性。5... 桑总写的真是深入浅出,除了技术指导以外,宏观上看到很多商业分析的方法论,佩服。1数据(离散元素)-信息(连接元素)-知识(组织信息)-智慧(应用知识)。2数据驱动=驱动据测(产品改进、运营优化、营销分析、商业决策)+产品智能(数据基础+算法模型+形成反馈)。3数据驱动的流=数据接入-实时/批量传输-建模/存储-统计/分析/挖掘-可视化/反馈。4大数据=宏观大量+全面数据源+不同维度细致+时效性。5八大数据分析:行为事件分析、漏斗分析、留存分析、分布分析、点击分析、用户路径、用户分群、属性分析。6根据公司阶段建立关键指标,如AAARR,实时监控。7建立数据平台架构,进行数据接收、清洗、存储、计算和查询。8理解两种用户画像,利用标签体系驱动产品智能。SY (展开)
2 有用 XDash 2018-04-21 02:19:33
尤其喜欢百度和最后垂直领域的实践案例,很难得有如此detail的披露。