何谓“大数据” by 徐子沛
这篇书评可能有关键情节透露
第七章: 大数据时代:通往计算型的智能社会
原文:徐子沛
整理&补充:喷嚏
Q:什么是大数据?何谓“大”?“数据”为何?
A:图形、语言、文字这三者并不能准确地描述世界,而且这三者的描述中主观色彩过于浓厚,容易造成误解。为了客观&精确地进行描述,数据被人类发明出来。(小插曲,现在我们使用的十进制仅仅只是因为人类有十只手指,如果人类有十二只手指的话,那么现存的运算可能会换下汤但是不换药。当然,还真的有使用十二进制的民族:玛雅,不知道它灭亡的原因和此有关否?哈哈,上述论断十分不严谨,请忽略~)
在以前,至少是计算机出现前。数据加上背景就成了信息,经过人类整理归纳的信息则会转变为知识。
不过,由于计算机存储是依赖二进制的,图片、语音等信息的本质也是数据,所以现在,数据同时也是信息的代名词。
再来谈谈“大”。“大数据”这个概念是在20世纪80年代被提出来的,此时的“大”指的是数据相对于软件的重要程度(内容重于载体)。而在21世纪前十年,尤其是2004年社交媒体产生后,“大”这个概念开始向容量偏移。不过徐先生认为“容量只是表象,价值才是本质”。
Q:孕育大数据的土壤有哪些?
A:主要有三:
1. 硬件——物理存储器的性能和大小。摩尔定律成真——同一面积芯片上可容纳的晶体管数量,一到两年将增加一倍。一兆字节存储量的成本由1955年的6000美元下降到今天的0.005美分。
2. 社交媒体时代的到来。进入web2.0后,人类对自己行为的记录开始成为这个世界数据的主角,至少在容量上是这般。
3. 数据挖掘&机器学习。其中机器学习基于的是带有自调适参数的算法,从数据中学习then找到真正有价值的知识。
Q:大数据能生出怎样的蛋?
A:用于社会计算去捕捉“人类历史上过去难以被捕捉的关系和知识”。例如,通过分析几千封名人之间的通信去研究文艺复兴时期特定新思想的首创者。当然还有孜孜不倦追求金钱的商家,他们能用数据换钞票。
Q:未来是怎样?
A:“万物皆联网,无处不计算” :
1. 最大的工业制造商通用电气要通过安装数以万计的传感器来监视一座厂房的运营情况,进而生产效率。
2. 谷歌收购智能家居设备商Nest,哦,花了32亿美元。
3. 世界会需要一大批数字机械工程师、软件工程师、数据科学家和人机交互界面专家。
Q:数据和计算在第三次工业革命中的作用是什么?
A:这得从3D打印机这个公认的工业4.0中最活跃的元素讲起。首先,每个用3D打印机完成的实物背后都有一个对应的数据包。其次,“3D打印”这个名词背后默默站着“众包”这个贤内助,而后者身上蕴含的,是巨大的社会能量。(看维基百科就知道啦!)以上两点构成了将来大数据的重要类别之一:物理实体的数据。同时3D技术加上大数据加上众包就构成一个即将到来的名词——社会制造!
Q:数据之巅上站着谁?
A:智能型社会——机器通过收集大量数据获得知识,自动完成任务。
原文:徐子沛
整理&补充:喷嚏
Q:什么是大数据?何谓“大”?“数据”为何?
A:图形、语言、文字这三者并不能准确地描述世界,而且这三者的描述中主观色彩过于浓厚,容易造成误解。为了客观&精确地进行描述,数据被人类发明出来。(小插曲,现在我们使用的十进制仅仅只是因为人类有十只手指,如果人类有十二只手指的话,那么现存的运算可能会换下汤但是不换药。当然,还真的有使用十二进制的民族:玛雅,不知道它灭亡的原因和此有关否?哈哈,上述论断十分不严谨,请忽略~)
在以前,至少是计算机出现前。数据加上背景就成了信息,经过人类整理归纳的信息则会转变为知识。
不过,由于计算机存储是依赖二进制的,图片、语音等信息的本质也是数据,所以现在,数据同时也是信息的代名词。
再来谈谈“大”。“大数据”这个概念是在20世纪80年代被提出来的,此时的“大”指的是数据相对于软件的重要程度(内容重于载体)。而在21世纪前十年,尤其是2004年社交媒体产生后,“大”这个概念开始向容量偏移。不过徐先生认为“容量只是表象,价值才是本质”。
Q:孕育大数据的土壤有哪些?
A:主要有三:
1. 硬件——物理存储器的性能和大小。摩尔定律成真——同一面积芯片上可容纳的晶体管数量,一到两年将增加一倍。一兆字节存储量的成本由1955年的6000美元下降到今天的0.005美分。
2. 社交媒体时代的到来。进入web2.0后,人类对自己行为的记录开始成为这个世界数据的主角,至少在容量上是这般。
3. 数据挖掘&机器学习。其中机器学习基于的是带有自调适参数的算法,从数据中学习then找到真正有价值的知识。
Q:大数据能生出怎样的蛋?
A:用于社会计算去捕捉“人类历史上过去难以被捕捉的关系和知识”。例如,通过分析几千封名人之间的通信去研究文艺复兴时期特定新思想的首创者。当然还有孜孜不倦追求金钱的商家,他们能用数据换钞票。
Q:未来是怎样?
A:“万物皆联网,无处不计算” :
1. 最大的工业制造商通用电气要通过安装数以万计的传感器来监视一座厂房的运营情况,进而生产效率。
2. 谷歌收购智能家居设备商Nest,哦,花了32亿美元。
3. 世界会需要一大批数字机械工程师、软件工程师、数据科学家和人机交互界面专家。
Q:数据和计算在第三次工业革命中的作用是什么?
A:这得从3D打印机这个公认的工业4.0中最活跃的元素讲起。首先,每个用3D打印机完成的实物背后都有一个对应的数据包。其次,“3D打印”这个名词背后默默站着“众包”这个贤内助,而后者身上蕴含的,是巨大的社会能量。(看维基百科就知道啦!)以上两点构成了将来大数据的重要类别之一:物理实体的数据。同时3D技术加上大数据加上众包就构成一个即将到来的名词——社会制造!
Q:数据之巅上站着谁?
A:智能型社会——机器通过收集大量数据获得知识,自动完成任务。