第一章 数据-人类建造文明的基石
- 章节名:第一章 数据-人类建造文明的基石
1. 人类通过观察现象,获得数据,提炼出信息,归纳出知识。由浅入深,逐级递进。人们通过这个方式,不断认识和改造这个世界。
2. 古埃及人通过对天象的观察,总结出天文学知识。美索不达米亚上的苏美人同样通过对天象的观察,计算出行星的运行周期,预测日食和月食。后来的学者们继承和发展了他们的天文学知识,为托勒密用数学模型概括天体运动轨迹奠定基础。托勒密是地心说的鼻祖,波兰天文家哥白尼则是日心说的创始人,遗憾的是他的数据不充分,无法自圆其说。后来的开普勒继承了日心说的衣钵,运气好到爆的他发现用椭圆就可以描述行星围绕太阳运行的轨道。可以说历史的进程,文明的发展,都离不开数据的存在。
3. 怎样正确从数据中挖掘更有价值的东西?相关性起到决定性作用。早在20世纪70年代,日本人就可以根据铁人王进喜的对外宣传图片,推测出大庆油田的基本信息。而在2009年,专家可以根据互联网用户在网上的搜索关键词频率,推测出甲型流感的蔓延趋势。表面上互不相关的数据之间,可能存在着令人惊奇的相关性。
4. 数学模型的基础离不开统计学,通过对样本的分析,可以得出结论。但是统计学的样本必须满足2个条件,样本量大、具有代表性。书中举例:1936年,文学文摘通过240万份大量的问卷预测,美国总统的大选结果,但最终结果反而输给了只发放了5万个样本的统计学家盖洛普。因为后者的样本更具有代表性,考虑了多种因素。时间推移,1948年的盖洛普预测结果却让人大跌眼镜,因为样本考虑的因素还是不够全面。
5. 在数学模型上,只要数据量足够多,可以用若干个简单模型取代一个复杂模型,被成为数据驱动方法。这也是大数据起作用的核心。举例:阿尔法狗战胜李在石,就是因为前者的高智能,来源于它学习了人类围棋历史上不计其数的对弈数据,在此基础上,得出了一个统计模型,针对不同情况可以做出有力判断,这一点是人类望尘不及的。
漫风对本书的所有笔记 · · · · · ·
-
第一章 数据-人类建造文明的基石
-
第二章 大数据和机器智能
1. 大量数据的出现,不仅仅是为人类认识和改造这个世界提供方法,而是能让电脑完成一些过去只...
-
第三章 思维的革命
1 同现代人津津乐道大数据一样,机械思维在过去也是很时髦的词汇。它的方法论在实际运用中,...
说明 · · · · · ·
表示其中内容是对原文的摘抄