《大数据 [3.0升级版]》的原文摘录

  • 之所以要称之为战略,是因为“大数据”之大,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识“、”大科技“、”大利润“和”大发展“。 数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。 得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。 (查看原文)
    安柏林 3赞 2013-02-05 15:12:38
    —— 引自第57页
  • 封面 除了上帝,任何人都必须用数据来说话。 数据竞争:数据性则企业兴,数据强则企业强。数据治国:足够多的眼睛,将使所有的错误无所遁形。数据开放:隐瞒政府实情的力量,就是摧毁这个政府的力量。 一个真正的信息社会,首先是一个公民社会。——作者题记 序言一 大数据:为华文世界提出一个重要话题 胡适说中国人习惯于“差不多先生”,凡事马马虎虎、不求精确。黄仁宇先生认为,中国不懂得用数字来管理国家。 在历史上看,不论中国和西方,任何国家发展到可以有一个复杂文官系统管理以后,没有不依照数据来治国。 “老大哥”的影子,可以无处不在。资讯时代,对于极权的掌权者,他们拥有无可比拟的强大工具,甚至于比坦克车和催泪弹更为有效。资讯管理、资讯控制,是无影无踪,又是无所不在。说到这里,我们不能不更警惕。 序言二 中国的雄心应该拓展到大数据领域 大数据之所以产生,是因为今天无处不在的传感器和微处理器。我们正在迈进普适计算时代。 “数据科学家”集黑客和定量分析员的优势和特长于一身,非常短缺。 序幕 新总统的第一天 你对你自己负有使命和责任。 我们个人的命运依赖于群体的命运。 只有你把你自己的战车和其他一些更为伟大的东西绑定到一起的时候,你才能发现你真正的能量。 共和党候选人杰克•瑞安(Jack Ryan) 前妻洁丽•瑞安(Jeri Ryan) 作为参选的政治人物,他不能享有和常人一样的隐私权,文件必须公开。 p007 根本任务,是要改变华盛顿的运行方式,营造一种新的行政文化,重建公众对于美国政府机关的信任。 要建立一个透明的、开放的政府。本届政府的基石是法治和透明。 13489号总统令 第一章 历史争战《信息自由法》 p017 美国社会的第四股力量(fourth Estate)是除了立法、执法和司法三权之外的“新闻和报纸”。 p019 哈罗德•克劳斯(Harold Cross) 《人民的知情权》只... (查看原文)
    zju_miracle 3赞 2015-09-08 01:10:37
    —— 引自第362页
  • 18世纪,英国著名的政治学家埃德蒙•伯克曾经一针见血地指出:“所有的政府,都是建立在妥协和交换的基础之上。” 他认为,政治的行为,在本质上,是一种妥协和交换。人类政府的历史, 其实是一部各种利益不断妥协与交换的历史,也只有在不断的妥协与交换中, 各种利益才可能获得相对的平衡。他继而指出,其实“人类所有的收益和快乐、 所有的美德、所有明智的行为”,无一不是妥协和交换。 对于这种妥协,美国的总统们并不忌讳。艾森豪威尔就曾经坦言说: “一提到中间路线,人们就认为这是不可以接受的。事实上,人类所有的大数问题,除了道德,都处在中间的灰色地带。事情并不是非黑即白。我们总是要妥协的。马路的中间才是全部可以使用的区域,最左边和最右边,都是沟渠等危险地带。” (查看原文)
    豆友62548153 1赞 2012-11-13 22:53:39
    —— 引自第27页
  • “一个好的数据结构和一个糟糕的代码比一个糟糕的数据结构和好的代码要强的多。” ——埃里克,雷蒙 美画软件开源运动的领导者,1999年 (查看原文)
    豆友62548153 1赞 2012-11-13 22:55:11
    —— 引自第41页
  • 中间选民理论 该理论实在1940年代提出的。在选举中,所有的选民都有自己的个人偏好,这个偏好对应于平面坐标上的一点,全部选民的偏好将呈正太分布,也就是一个钟型曲线,这个曲线就是民意分布图。 每个选民最终都会把自己的选票投给与自己意见最接近的候选人。在多个候选人竞争的情况下,候选人想要胜出,就要争取最多的选票,他就必须找准民意最集中的地方,为最多的民众说话,这一点,就是民意的“中值”。 (查看原文)
    安柏林 2013-01-07 14:53:43
    —— 引自第46页
  • 从政治学的意义上来说,组织起来的少数就是政治上的多数。-----杰斯 杰克逊 美国非裔民权活动家 “政府俘虏理论”,即斯蒂格勒所指出的政府监管部门最终会被产业界俘虏,其监管标准也会被商家所左右。 ............公共利益的代表缺位,是人类社会发展中的困局,每一个社会都难以避免。 .........当集体越小,利益冲突越激烈的时候,越容易联合;当集体越大,利益冲突并不明显的时候,越难联合。 早在2000多年前,亚里士多德就观察到: “凡是属于最多数人的公共事务,却常常受到最少人的照顾。人们关怀着自己的所有,而忽视公共事务;对于公共的一切,他至多只留心到其中和他个人有些相关的事物。” 奥尔森的理论其实也很好地解释了专制制度为什么能在一些国家长期存在。 专制者将一个国家大部分人的一部分权力和自由都剥夺了、抹杀了,大家都憎恶专制,但在一定时间、一定程度内,却很少有人反抗。为什么?这是因为,通过反抗,即使能推翻专制制度,其结果是所有人都受益,但出头冒尖的人却可能要付出极大的代价。人的自利天性,使大部分人都选择了沉默,并把希冀的目光投向他人。 专制者当然也懂得这个道理,他在维护专制的同时,会不遗余力的打击出头冒尖的反抗者,杀鸡儆猴,全力瓦解一切可能发生的集体行动。 但是,奥尔森还是看到了文明的力量。他认为,公共利益的代表缺位、专制社会的困境,最终是可以打破的。 答案是:一个集体、一个社会,要建立合适的激励机制,奖励那些为共同利益做贡献的个人,惩罚那些没有承担集体行动成本的“搭便车者”,从而营造关心公共利益的社会文化和运行机制。 更重要的是,一个社会必须有完善的利益代表机制。.......有两个关键。 一是授权制度。........当一个代表接受了一个群体的权利让渡之后,他就可能上升到职业化的高度、提出专业化的意见,他所代表的人群也就成了一个利益相关的集... (查看原文)
    机器猫 1赞 2013-01-07 22:14:38
    —— 引自第152页
  • 政治的行为,在本质上,是一种妥协和交换。人类政府的历史其实是一部各种利益不断妥协与交换的历史,也只有在不断的妥协与交换中,各种利益才可能获得相对的平衡。 (查看原文)
    Mila雨 2012-07-28 00:02:15
    —— 引自第26页
  • 公共数据开放的8大原则 1、数据必须是完整的 2、数据必须是原始的 3、数据必须是及时的 4、数据必须是可读取的 5、数据必须是机器可处理的 6、数据的获取必须是无歧视的 7、数据格式必须是通用非专有的 8、数据必须是不需要许可证的 如果我们坐等他人,那改变就不会到来。我们自己-就是一直再等的人,我们自己-就是我们所要寻求的改变。奥巴马Obama (查看原文)
    森林大帝 2012-08-12 10:04:50
    —— 引自第192页
  • 一个真正的信息社会,首先是一个公民社会。 (查看原文)
    佳宝杨梅 2012-09-05 21:39:20
  • 下一代互联网本质上就是"数据网"(Web of Data) (查看原文)
    佳宝杨梅 2012-09-10 23:37:39
    —— 引自第272页
  • 麦肯锡公司下属的全国研究所(McKinsey Global Institute)出版了一份专门的研究报告《大数据:下一个创新、竞争和生产率的前沿》. (查看原文)
    晴空 2012-09-16 13:05:26
    —— 引自第37页
  • 2001年,著名的高德纳咨询公司(Gartner)在一份研究报告中指出,数据的爆炸是“三维的”、是立体的,这三个维度,主要表现在以下三个方面:一是同一类型的数据量在快速增大;二是数据增长的速度在加快;三是数据的多样性,即新的数据来源和新的数据种类在不断增加。 (查看原文)
    晴空 2012-09-16 13:11:29
    —— 引自第55页
  • 2010年12月,总统行政办公室下属的科学技术顾问委员会(PCAST)、信息技术顾问委员会(PITAC)向奥巴马和国会提交了《规划数字化未来》的专门报告,该报告把数据收集和使用的工作,提到了战略的高度。 (查看原文)
    晴空 2012-09-16 13:13:58
    —— 引自第56页
  • 2001年,加州州政府率先退出了一个数据挖掘的项目“保险补助双向核对”(Medical-Medicaid Data Math),将医疗保险和医疗补助两个项目的数据整合起来,利用两个计划中的人员、时间、价格、地点等数据信息对每一宗申报进行互相核实,通过计算机算法自动确定互相矛盾、有异于常态的支付记录,一旦发现造假或者不实申报的可疑账单,则转入人工追讨的环节。 (查看原文)
    晴空 2012-09-16 13:18:36
    —— 引自第75页
  • “大数据”这个名词并不新鲜,早在1980年代,美国就有人提出了“大数据”的概念 “大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的只是,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。 (查看原文)
    晴空 2012-09-16 13:43:42
    —— 引自第57页
  • 在重谋略与诡辩的文化中,政治家的聪明才智在拼搏中相互抵消 (查看原文)
    Gloriaral 2012-09-29 18:21:34
    —— 引自第113页
  • 图形是解决逻辑问题的视觉方法。原文结束> 南丁格尔一份英国士兵死亡的“极区图”,极富逻辑与图形融合的历史第一份。 <原文开始>“未来的计算机不仅要能计算,还要能将计算结果转变为直观的图形。我们应该研究这两种结果,因为每一种都有助于我们理解问题。 (查看原文)
    画船听雨眠 2012-10-04 14:01:45
    —— 引自第102页
  • 作为一个新兴的行业,数据可视化的发展潜力不容小觑。2010年起,谷歌的首席经济学家范里安就一直在多种场合强调,下一个十年,将出现一类新的专业人才:数据科学家。其中一种,正是数据可视化工程师,这种人才既懂得数据分析,又精通构图的艺术,集故事讲述和艺术家的特质于一身,将是我们大数据时代的导航员。 (查看原文)
    苏南 1回复 2012-10-30 19:02:23
    —— 引自第109页
  • 未来的语义网,却不是一个众多网页的链接体,而是一个全球性数据库。在这个数据库中,各种相关数据通过“元数据”互相联结,计算机将根据元数据,自动为我们搜寻、检索和集成网上的信息,不再需要搜索引擎。 (查看原文)
    苏南 2012-10-31 18:23:22
    —— 引自第286页
  • 在美国这个文化传统中,事实是推论的基础,所谓良知,首先是诚实面对全部事实、从真实的前提出发,不在思辨中途偷换概念,然后,让逻辑自己走,它自然会推出结论来。……在重谋略与诡辩的文化中,政治家的聪明才智在拼搏中 相互抵消。 ——林达,美籍华人作家,2011年 (查看原文)
    豆友62548153 2012-11-13 22:56:02
    —— 引自第113页
<前页 1 2 3 4 后页>