出版社: 浙江人民出版社
出品方: 湛庐文化
副标题: 生活、工作与思维的大变革
原作名: Big Data:A Revolution That Will Transform How We Live, Work, and Think
译者: 周涛
出版年: 2012-12
页数: 261
定价: 49.90元
装帧: 平装
ISBN: 9787213052545
内容简介 · · · · · ·
《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。
维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可...
《大数据时代》是国外大数据研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
维克托•迈尔•舍恩伯格在书中前瞻性地指出,大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型,并用三个部分讲述了大数据时代的思维变革、商业变革和管理变革。
维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。
本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。
作者简介 · · · · · ·
他是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。
他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;而他自己早在1986年与1995年就担任两家软件公司的...
他是十余年潜心研究数据科学的技术权威,他是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一。他曾先后任教于世界最著名的几大互联网研究学府。现任牛津大学网络学院互联网治理与监管专业教授,曾任哈佛大学肯尼迪学院信息监管科研项目负责人,哈佛国家电子商务研究中网络监管项目负责人;曾任新加坡国立大学李光耀学院信息与创新策略研究中心主任。并担任耶鲁大学、芝加哥大学、弗吉尼亚大学、圣地亚哥大学、维也纳大学的客座教授。
他的学术成果斐然,有一百多篇论文公开发表在《科学》《自然》等著名学术期刊上,他同时也是哈佛大学出版社、麻省理工出版社、通信政策期刊、美国社会学期刊等多家出版机构的特约评论员。
他是备受众多世界知名企业信赖的信息权威与顾问。他的咨询客户包括微软、惠普和IBM等全球顶级企业;而他自己早在1986年与1995年就担任两家软件公司的总裁兼CEO,由他的公司开发的病毒通用程序,成为当时奥地利最畅销的软件产品。1991年跻身奥地利软件企业家前5名之列,2000年 被评为奥地利萨尔斯堡州的年度人物。
他也是众多机构和国家政府高层的信息政策智囊。他一直专注于信息安全与信息政策与战略的研究,是欧盟专家之一,也是世界经济论坛、马歇尔计划基金会等重要机构的咨询顾问,同时他以大数据的全球视野,熟悉亚洲信息产业的发展与战略布局,先后担任新加坡商务部高层、文莱国防部高层、科威特商务部高层、迪拜及中东政府高层的咨询顾问。
所著《大数据》一书是开国外大数据系统研究的先河之作,而在这之前,他已经在《经济学人》上和数据编辑肯尼斯.尼尔-库克耶一起,发表了长达14页的大数据专题文章,成为最早洞见大数据时代趋势的数据科学家之一。而他的《删除》一书,同样被认为是关于数据的开创性作品,并且创造了“被遗忘的权利”的概念而在媒体圈和法律圈得到广泛运用。该书获得美国政治科学协会颁发的唐•K•普赖斯奖,以及媒介环境学会颁发的马歇尔•麦克卢汉奖。同时受到《连线》、《自然》《华尔街日报》《纽约时报》等各大权威媒体广泛好评。
目录 · · · · · ·
第一部分 大数据时代的思维变革
第1章 更多:不是随机样本,而是所有数据
第2章 更杂:不是精确性,而是混杂性
第3章 更好:不是因果关系,而是相关关系
第二部分 大数据时代的商业变革
· · · · · · (更多)
第一部分 大数据时代的思维变革
第1章 更多:不是随机样本,而是所有数据
第2章 更杂:不是精确性,而是混杂性
第3章 更好:不是因果关系,而是相关关系
第二部分 大数据时代的商业变革
第4章 数据化:一切皆可“量化”
第5章 价值:“取之不尽,用之不竭”的数据创新
第6章 角色定位: 数据、技术与思维的三足鼎立
第三部分 大数据时代的管理变革
第7章 风险:让数据主宰一切的隐忧
第8章 掌控:自由与责任并举的数据管理
结语 已经发生的未来
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
-
Google:系统唯一关注的就是特定检索词条的频繁使用与流感在时间和空间上的传播关系之间的联系。 社会新能力:前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,与深刻洞见。 Oren Erzioni:Harvard CS 1st(1986 grad) 飞机票价格预测 到2012年为止,Farecast系统用了将近十万一条价格记录来帮助预测美国国内航班的票价。准确度高达75%。 社会需要放弃它对因果关系的渴求,而今需关注相关关系,只要知道是什么,不需要知道为什么。 硅谷技术成熟度曲线:经过新闻媒体和学术会议的宣传后,新技术趋势一下子跌到谷底。 【大数据先锋】:天文学,信息爆炸的起源 人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度比世界经济增长速度快9倍。 量变导致质变,当我们改变规模时,事物的状态有时也会发生改变。 纳米技术! 大数据是把数学算法用到海量的数据上来预测事情发生的可能性。 大数据【我们分析信息时的三个转变】: 1.我们可以分析更多数据,甚至处理和某个特别现象相关的所有数据,而不依赖与随机采样。 2.研究数据如此之多,以至于我们不再热衷于追求精确度。只要掌握大题的发展方向就好。 3.不再热衷于寻找因果关系,二是相关关系。 大数据对个人的影响是惊人的,使专业性不那么重要了。 【马其诺防线?】 !对我们而言,危险不再是隐私的泄露,而是被预知的可能性。 【IBM资深大数据专家】:Jeff Jonas:要让数据说话。 【大数据与三个重大的思维转变有关】: 1.要分析于某事物相关的所有数据,而不是依靠分析少量的数据样本。 2.乐于接受数据的纷繁复杂,而不再追求精确性。 3.不再探求因果,而是相关。 当样本数量达到了某个之后,我们从新个体身上得到的信息会越来越少,就如同经济学中的边... (查看原文) —— 引自章节:前三章 -
危险不再是隐私的泄露,而是被预知的可能性 (查看原文) —— 引自第22页
> 全部原文摘录
喜欢读"大数据时代"的人也喜欢的电子书 · · · · · ·
大数据时代的话题 · · · · · · ( 全部 条 )



大数据时代的书评 · · · · · · ( 全部 487 条 )
-
李小盆兒 (请叫我小盆兒,小盆,盆儿,盆~)
执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是有框架的,是能适用于传统数据库的。如果不接受混乱,剩下95%的非框架数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。 当数据只有500万的时候,简单的算法表现得很差,但数据达10亿的时候,它变成表现得最好的,准确率从原来的75%提高到95%以上。 大数据的简单算法比小数据的复杂算法更有效。2012-12-20 10:54 21人喜欢
-
程 諾 (祈福)
所以,维克托赞同许多物理学家的看法,世界的本质就是数据。因此,大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论将会转变为实证科学中的具体问题。可知性是绝对的,无事无物不可知;不可知性是相对的,是尚未知道的意思。 首先,作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样... (3回应)2013-07-22 10:47 9人喜欢
所以,维克托赞同许多物理学家的看法,世界的本质就是数据。因此,大数据时代的经济学、政治学、社会学和许多科学门类都会发生巨大甚至是本质上的变化和发展,进而影响人类的价值体系、知识体系和生活方式。哲学史上争论不休的世界可知论和不可知论将会转变为实证科学中的具体问题。可知性是绝对的,无事无物不可知;不可知性是相对的,是尚未知道的意思。 首先,作者抛出了大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果;接着,从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后,作者冷静描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。 今天,一种可能的方式是,亦是本书采取的方式,认为大数据是人们在大规模数据的基础上可以做到的事情,而这些事情在小规模数据的基础上是无法完成的。大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。 这仅仅只是一个开始,大数据时代对我们的生活,以及与世界交流的方式都提出了挑战。最惊人的是,社会需要放弃它对因果关系的渴求,而仅需关注相关关系。也就是说只需要知道是什么,而不需要知道为什么。这就推翻了自古以来的惯例,而我们做决定和理解现实的最基本方式也将受到挑战。 大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性. 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。 数据化意味着我们要从一切太阳底下的事物中汲取信息,甚至包括很多我们以前认为和“信息”根本搭不上边的事情。 大数据时代开启了一场寻宝游戏,而人们对于数据的看法以及对于由因果关系向相关关系转化时释放出的潜在价值的态度,正是主宰这场游戏的关键。 寻找原因是一种现代社会的一神论,大数据推翻了这个论断。但我们又陷入了一个历史的困境,那就是我们活在一个“上帝已死”的时代。也就是说,我们曾经坚守的信念动摇了。讽刺的是,这些信念正在被“更好”的证据所取代。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。 值得注意的是,错误性并不是大数据本身固有的。它只是我们用来测量、记录和交流数据的工具的一个缺陷。如果说哪天技术变得完美无缺了,不精确的问题也就不复存在了。错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在。因为拥有更大数据量所能带来的商业利益远远超过增加一点精确性,所以通常我们不会再花大力气去提升数据的精确性。这又是一个关注焦点的转变,正如以前,统计学家们总是把他们的兴趣放在提高样本的随机性而不是数量上。如今,大数据给我们带来的利益,让我们能够接受不精确的存在了。 互联网上最火的网址都表明,它们欣赏不精确而不会假装精确。这并不代表系统不知道正确的数据是多少,只是当数量规模变大的时候,确切的数量已经不那么重要了。 社会将两个折中的想法不知不觉地渗入了我们的处事方法中,我们甚至不再把这当成一种折中,而是把它当成了事物的自然状态。 第一个折中是,我们默认自己不能使用更多的数据,所以我们就不会去使用更多的数据。但是,数据量的限制正在逐渐消失,而且通过无限接近“样本=总体”的方式来处理数据,我们会获得极大的好处。 第二个折中出现在数据的质量上。在小数据时代,追求精确度是合理的。因为当时我们收集的数据很少,所以需要越精确越好。如今这依然适用于一些事情。但是对于其他事情,快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多。 知道人们为什么对这些信息感兴趣可能是有用的,但这个问题目前并不是很重要。但是,知道“是什么”可以创造点击率,这种洞察力足以重塑很多行业,不仅仅只是电子商务。所有行业中的销售人员早就被告知,他们需要了解是什么让客户做出了选择,要把握客户做决定背后的真正原因,因此专业技能和多年的经验受到高度重视。大数据却显示,还有另外一个在某些方面更有用的方法。亚马逊的推荐系统梳理出了有趣的相关关系,但不知道背后的原因。知道是什么就够了,没必要知道为什么。 多年来,经济学家和政治家一直错误地认为收入水平和幸福感是成正比的。我们从数据图表上可以看到,虽然统计工具呈现的是一种线性关系,但事实上,它们之间存在一种更复杂的动态关系:对于收入水平在1万美元以下的人来说,一旦收入增加,幸福感会随之提升;但对于收入水平在1万美元以上的人来说,幸福感并不会随着收入水平提高而提升。如果能发现这层关系,我们看到的就应该是一条曲线,而不是统计工具分析出来的直线。 在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果,而这个结果又是由其他原因导致的,以此循环往复,那么就不存在人的自由意志这一说了——所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立的。当然,关于理论的争辩并不是我们要研究的重点。 相关关系很有用,不仅仅是因为它能为我们提供新的视角,而且提供的视角都很清晰。而我们一旦把因果关系考虑进来,这些视角就有可能被蒙蔽掉。 大数据是在理论的基础上形成的。比方说,大数据分析就用到了统计和数学理论,有时候也会用到计算机科学理论。是的,这不是关于像地心引力这样特定现象的产生原因的理论,但是无论如何这依然是理论。而且如我们所见,建立在这些理论上的大数据分析模式是实现大数据预测能力的重要因素。事实上,就是因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。 大数据时代将要释放出的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来的必然改变。但是在我们到达目的地之前,我们有必要了解怎样才能到达。 我们还没有合适的词用来形容莫里和越水重臣教授所做的这些转变,所以我们姑且称其为“数据化”吧——这是指一种把现象转变为可制表分析的量化形式的过程。 莱维斯说,“预测给我们知识,而知识赋予我们智慧和洞见。”他很确信,有一天,这个系统一定能在用户意识到问题之前预测到并且解决问题。 有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。 随着大数据的出现,数据的总和比部分更有价值。当我们将多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和更大。 根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:数据本身、技能与思维。 第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。最好的例子就Twitter,它拥有海量数据这一点是毫无疑问的,但是它的数据都通过两个独立的公司授权给别人使用。 第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的才能。比方说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司(Teradata)的分析来获得营销点子,天睿就是一家大数据分析公司。 第三种是基于思维的公司。皮特·华登(Pete Warden),Jetpac的联合创始人,就是通过想法获得价值的一个例子。Jetpac通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于某些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和员工的创新思维,他们有怎样挖掘数据的新价值的独特想法。 大数据还会带来更多的威胁,毕竟,大数据的核心思想就是用规模剧增来改变现状。我们也将分析它是如何加深对我们隐私的威胁的,同时还将面对一个新的挑战,即运用大数据预测来判断和惩罚人类的潜在行为。这是对公平公正以及自由意志的一种亵渎,同时也轻视了决策过程中深思熟虑的重要性。 除了纠结于数据的准确性、正确性、纯洁度和严格度之外,我们也应该容许一些不精确的存在。数据不可能是完全对或完全错的。当数据的规模以数量级增加时,这些混乱也就算不上问题了。事实上,它甚至可以是有好处的,因为当我们只想使用一小部分时,无须捕捉这么多的知识细节。又因为我们可以用更快更便宜的方式找到数据的相关性,并且效果往往更好,而不必努力去寻找因果关系。当然在某些情况下,我们仍然需要精心策划的数据来做因果关系研究和控制实验,如测试药物的副作用或设计关键的飞机部件。但是在日常情况下,知道“是什么”就已经足够,不必非要弄清楚“为什么”。大数据的相关性将人们指向了比探讨因果关系更有前景的领域。 大数据并不是一个充斥着运算法则和机器的冰冷世界,其中仍需要人类扮演重要角色。人类独有的弱点、错觉、错误都是十分必要的,因为这些特性的另一头牵着的是人类的创造力、直觉和天赋。偶尔也会带来屈辱或固执的同样混乱的大脑运作,也能带来成功,或在偶然间促成我们的伟大。这提示我们应该乐于接受类似的不准确,因为不准确正是我们之所以为人的特征之一。就好像我们学习处理混乱数据一样,因为这些数据服务的是更加广大的目标。毕竟混乱构成了世界的本质,也构成了人脑的本质,而无论是世界的混乱还是人脑的混乱,学会接受和应用它们才能得益。
3回应 2013-07-22 10:47 -
Google:系统唯一关注的就是特定检索词条的频繁使用与流感在时间和空间上的传播关系之间的联系。 社会新能力:前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,与深刻洞见。 Oren Erzioni:Harvard CS 1st(1986 grad) 飞机票价格预测 到2012年为止,Farecast系统用了将近十万一条价格记录来帮助预测美国国内航班的票价。准确度高达75%。 社会需要放弃它对因果关系的渴求,而今需关注相关关系,只要知道是...
2013-01-24 16:49 9人喜欢
Google:系统唯一关注的就是特定检索词条的频繁使用与流感在时间和空间上的传播关系之间的联系。 社会新能力:前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,与深刻洞见。 Oren Erzioni:Harvard CS 1st(1986 grad) 飞机票价格预测 到2012年为止,Farecast系统用了将近十万一条价格记录来帮助预测美国国内航班的票价。准确度高达75%。 社会需要放弃它对因果关系的渴求,而今需关注相关关系,只要知道是什么,不需要知道为什么。 硅谷技术成熟度曲线:经过新闻媒体和学术会议的宣传后,新技术趋势一下子跌到谷底。 【大数据先锋】:天文学,信息爆炸的起源 人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度比世界经济增长速度快9倍。 量变导致质变,当我们改变规模时,事物的状态有时也会发生改变。 纳米技术! 大数据是把数学算法用到海量的数据上来预测事情发生的可能性。 大数据【我们分析信息时的三个转变】: 1.我们可以分析更多数据,甚至处理和某个特别现象相关的所有数据,而不依赖与随机采样。 2.研究数据如此之多,以至于我们不再热衷于追求精确度。只要掌握大题的发展方向就好。 3.不再热衷于寻找因果关系,二是相关关系。 大数据对个人的影响是惊人的,使专业性不那么重要了。 【马其诺防线?】 !对我们而言,危险不再是隐私的泄露,而是被预知的可能性。 【IBM资深大数据专家】:Jeff Jonas:要让数据说话。 【大数据与三个重大的思维转变有关】: 1.要分析于某事物相关的所有数据,而不是依靠分析少量的数据样本。 2.乐于接受数据的纷繁复杂,而不再追求精确性。 3.不再探求因果,而是相关。 当样本数量达到了某个之后,我们从新个体身上得到的信息会越来越少,就如同经济学中的边际效益递减一样。 随机采样不是和考察子类别的情况,因为一旦继续细分,随机采样的结果的错误率会大大增加。就像模拟照片打印,远看不错,一旦聚焦某个点就会模糊不清。 【DNA分析】2012年,基因组解码的价格跌破1000美元,这也是非正式的行业平均水平。从2007年期,硅谷新兴的科技公司23 and me就开始分析人类基因,价格仅为几百美元。 Jobs是世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。支付了几十万美元。他得到的是包括整个基因密码的数据文档。 【全数据模式:样本=总体】 通过使用所有数据,我们可以发现可能会在大量数据中淹没调的情况。eg:信用卡诈骗是通过观察异常情况来识别的。 谷歌流感趋势预测建立在数亿的数学模型上,而它们又建立在数十亿数据节点的基础之上。 【cool!Lytro相机,把大数据用到了基本的摄影中,可以记录整个广场里的所有光,达1100万之多,具体生成什么样的照片可以在拍摄后再根据需要决定,没有必要一开始就聚焦。】 【哇哦,托福听力【=。=|| social network point:如果把一个在社区内有很多链接关系的人从社区关系网中提出开来,这个关系网就会变的没那么搞笑但却不会解体;但如果把一个与所在社区之外的很多人有着连接关系的人从这个关系网中剔除,整个关系网很快就会破碎成很多小块。 【混乱性】:不精确,格式不一致。 谷歌翻译!接受了有错误的数据 《数据的非理性效果》:大数据的简单算法比小数据的复杂算法更有效。 错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题,并且有可能长期存在。 BBP(the billion prices project) MIT的两位经济学家(Alberto Cavell 和 Oberto Rigobon)提出了一个大数据方案,接受更混乱的数据,提供给联邦政府。通过一个软件在互联网上收集信息。 照片的标签取代预先的分类标准。 传统的数据库引擎要求数据高度精确和准确排列,数据不是单纯地被存储,它往往被划分为包含“域”的记录,每个域都包含了特定种类和特定长度的信息。 索引时实现就设定好了的,这就限制了人们的搜索。增加一个新的索引往往既消耗时间,又惹人争议,因为需要改变底层的设计。 非关系型数据库出现,包容了结构多样性,要求更多的 Pat Helland:来自微软的世界上最权威的数据库设计专家之一:《如果你有足够多的数据,那么“足够好”真的足够好》:处理海量数据会不可变面的导致部分信息的确实,虽然有“损耗性”,但是能快速得到想要的结果弥补了这个缺陷。 【多样性】是解决同步更新的一种方法。 Hadoop是与谷歌的MapReduce系统相对应的开原市分布系统的基础架构,非常善于处理超大量的数据。通过八大数据变成小模块然后分配给其他机器进行分析,它实现了对超大数据的处理。它预设硬件可能会瘫痪,所以在内部建立数据的副本,他还家丁数据两只大导致数据在处理之前不可能整齐排练。它假定了数据量的巨大时的数据完全无法移动,所以人们必须在本地进行数据分析。 H的数据输出结果没有关系型数据库输出的结果那么精确,他不能用于卫星发射这种精确度要求很高的任务,但是顾客细分这种就很快。 VISA使用Hadoop. Zest Finance由谷歌前任首席信息官道格拉斯·梅里尔创立。帮助决策者判断是否应该想拥有不良信息的人提供小额短期贷款。 只有5%的数字数据是结构化的且能适用于传统数据库。 【社会的两个折中的想法】: 1.我们默认自己不能使用更多的数据,所以我们就不回去使用更多的数据。但是,数据量的限制正在逐渐消失,而且通过无限接近“样本=总体”的方式来处理数据,我们会获得极大的好处。 2.在小数据时代,追求精确度是合理的。但是对于其他事情,快速获得一个大概的轮廓和发展脉络比严格的精确性要重要的多。 大数据更强调数据的完整性和混乱性,帮助我们进一步接近事实真相。“部分”和“确切”的吸引力是可以理解的。但是,当我们的事业局现在我们可以分析和能够确定的数据上市,我们对世界的整体理解就可能产生偏差和错误。 引自 前三章 回应 2013-01-24 16:49
-
随着世界的万世万物都在以极高的速度迅速的数据化,包括人,包括社会和物质世界,我们不断得用到云计算,物联网都是这个过程中的现象,当世界的万世万物都数据化的时候积累下来的庞大的不知如何下嘴的那样一个数据的堆积,规模之大,挑战之复杂,形成了未知的巨大的财富,或者叫资源,我们管这个资源、资产叫大数据。对资源、资产的理解,利用,挖掘,使得人类的生活方式由此产生巨大的变化叫做大数据时代。"
2013-01-20 09:41
-
作者/克里斯蒂安·福克斯 摘要 当前,资本主义社会进入了大数据资本主义时代。在这一时代,马克思的理论所固有的批判性与辩证性是理解、分析、批判大数据资本主义社会的有力武器。社交媒体用户的消费性数字劳动是再生产劳动的重要组成部分,由此促发了新的生产关系以及资本主义内部数字产品商品化与共享化之间的对立。随之而来的是总体利润率的下降和资本主义社会经济危机的出现,以及经济危机向意识形态危机的转变。文章认为,...
2021-01-17 19:08 4人喜欢
作者/克里斯蒂安·福克斯 摘要 当前,资本主义社会进入了大数据资本主义时代。在这一时代,马克思的理论所固有的批判性与辩证性是理解、分析、批判大数据资本主义社会的有力武器。社交媒体用户的消费性数字劳动是再生产劳动的重要组成部分,由此促发了新的生产关系以及资本主义内部数字产品商品化与共享化之间的对立。随之而来的是总体利润率的下降和资本主义社会经济危机的出现,以及经济危机向意识形态危机的转变。文章认为,资本主义社会意识形态的重要特征体现为夸大国与国之间的冲突以转移国民对国内矛盾和冲突的关注,宣扬民族主义以化解国内政治经济危机。因此,全世界的进步力量需要团结一致,形成反对右翼独裁主义的同盟,一起朝着共同体社会迈进。 一、引言 计算机的运行依赖数字计算,它们将信息转换为字节流,以便存储、处理和传输。资本主义和官僚行政的逻辑推动了信息处理技术的发展。由于政治经济利益、人们的需求以及技术的发展,数据总量、数据速率、数据多样性[1]已经发展到了由量变到质变的程度。简而言之,我们见证了大数据的兴起。越来越多的数字算法和数字机器正在不断生成、收集、存储、处理和评估大数据,并作出使人在经济、政治和日常生活中被边缘化的决策。这一发展导致了具有特定属性的数字资本主义的出现:大数据资本主义。大数据资本主义需要我们评估思想体系、知识形式、政治经济、治理术、基础设施、实践、组织、机构、主体、空间[2]、时间、话语和意识形态的变化。下文将探讨马克思的理论对理解和批判大数据资本主义政治经济的重要性。本文首先分析了马克思在当下的重要性,然后介绍了大数据资本主义的概念,分析了数字劳动的悖论、数字资本主义危机和当下的意识形态,最后以对大数据资本主义替代方案的思考结束全文。 二、马克思对当下的意义 今天我们为什么仍然需要马克思?这至少有14个方面的原因。只要资本主义和阶级还依然存在,马克思对理解、批判和改造社会就依然是至关重要的。正如马克思基于持续发展的辩证观对资本主义和社会的历史性的分析,马克思的方法本身也是辩证的。 第一,我们今天仍然需要关注马克思对商品形式和资本的分析。“资本主义生产方式占统治地位的社会的财富,表现为‘庞大的商品堆积’。” [3]新自由主义资本主义引发了包括通讯在内的几乎一切事物的商品化。在数字商品世界,我们发现了数字劳动力、数字信息、数字技术和网络受众的商品化。而信息“不会因使用而耗尽”的特点使信息消费具有“非排他性”(non-rivalrous)。信息可以被轻松地复制且很难杜绝他人访问或使用的特点使其成为了一种矛盾的商品:它既可以被转化为商品,又可以相对容易地抵挡商品化而变为公共利益(common good)。因此,数字资本主义面临着数字资本化与数字共有化之间的矛盾。 第二,马克思的理论有助于我们理解当下的劳动剥削。“无产者不过是生产剩余价值的机器,而资本家也不过是把这剩余价值转化为追加资本的机器。” [4]今天的无产阶级采取了新的形式:一是临时劳工,比如没有薪酬的实习生和学徒工,他们的劳动虽有别于我们所熟悉的劳动形式,却也创造价值;二是国际数字劳动分工中的劳动者。 第三,马克思分析了资本主义的全球化。资产阶级“必须到处落户,到处开发,到处建立联系” [5]。自20世纪末以来,资本主义发展远比在福特主义发展时期更加全球化,已进入了帝国主义资本主义的新阶段。 第四,马克思的理论对理解资本主义危机具有重要意义。马克思曾强调,资本主义经济与资本主义社会之间的矛盾会不断产生危机。“使实际的资产者最深切地感到资本主义社会充满矛盾的运动的,是现代工业所经历的周期循环的各个变动,而这种变动的顶点就是普遍危机。” [6] 第五,马克思对技术与社会之间辩证关系的强调有助于我们理解当代的技术。马克思在《资本论》第1卷第13章(机器和大工业)和《政治经济学批判大纲》的“机器论片段”中都对技术做了分析。马克思对技术的分析是以黑格尔有关本质与存在的辩证法为基础的。在《资本论》第1卷的《机器和大工业》这一章节中,马克思指出:“因为机器就其本身来说缩短劳动时间,而它的资本主义应用延长工作日;因为机器本身减轻劳动,而它的资本主义应用提高劳动强度;因为机器本身是人对自然力的胜利,而它的资本主义应用使人受自然力奴役;因为机器本身增加生产者的财富,而它的资本主义应用使生产者变成需要救济的贫民。” [7] 第六,马克思对一般智力(general intellect)的分析在今天依然重要。一般智力的概念表明,“一般社会知识已经变成了直接的生产力” [8]。一般劳动(universal labour)产生一般智力。“一般劳动是一切科学劳动,一切发现,一切发明。” [9]知识、交往和技术由此变为公共利益。马克思曾预测到了信息经济的出现。资本主义对利润的渴求带来了提高生产力的的需求,而技术的不断进步又增强了科学、技术与知识在生产过程中的相互关联。在资本主义发展到特定阶段,“量”转变成了信息资本主义时代新型的“质”。 第七,马克思的理论对理解数字资本主义至关重要。在《政治经济学批判大纲》中,马克思曾从概念上预见了互联网的出现,他指出,通过通信和电报联系,“每一单个人可以获知其他一切人的活动情况,并力求使本身的活动与之相适应” [10]。这一构想预见了互联网将成为全球性的信息、交流和社交网络系统。 第八,马克思对生产力与生产关系之间矛盾的论述对理解当代资本主义政治经济学至关重要。“由资本形成的一般的社会权力和资本家个人对这些社会生产条件拥有的私人权力之间的矛盾,越来越尖锐地发展起来,并且包含着这种关系的解体,因为它同时包含着把生产条件改造成为一般的、公共的、社会的生产条件。这种改造是由生产力在资本主义生产条件下的发展和实现这种发展的方式决定的。” [11]在数字资本主义中,网络化的数字生产力与生产关系是对立的。网络数字技术创建了商品化和剥削的新形式,也带来了新的积累问题。然而,作为商品的数字信息又具有阻碍商品化的特点。数字资本主义植根于数字共享与数字商品化之间的对立。数字化既塑造了“无产阶级社会协作与资本(经济和政治)掌控之间的矛盾” [12],又同时被这一矛盾所塑造。 第九,马克思在今天仍然重要的原因还在于:马克思的理论以及马克思主义理论传统中的各种方法使我们建立起了一套关于交往与语言的批判理论。比如,马克思指出:“名叫彼得的人把自己当做人,只是由于他把名叫保罗的人看做是和自己相同的。” [13]交往是人们为了解释现实世界、相互理解、构建共同意义、改变社会现实而借助符号进行的相互交流。格奥尔格·卢卡奇(Georg Lukács)的社会存在本体论、雷蒙德·威廉姆斯(Raymond Williams)的文化唯物主义以及其他的马克思主义理论方法构建了辩证的交往批判理论,这些理论可以替代尤尔根·哈贝马斯(Jürgen Habermas)的二元交往理论和尼克拉斯·卢曼(Niklas Luhmann)的关于沟通的系统理论。 第十,马克思让我们思考经济基础和上层建筑的概念,这就提出了如何反思交往在资本主义社会中的作用的问题。马克思提醒我们,思考经济/社会、工作/交往、资本/权力、劳动/意识形态、身体/思想、体力劳动/脑力劳动、生产/再生产之间是如何关联在一起至关重要。社会的二重性与资本主义之间既有同一性,又有差异性,并构成辩证关系。威廉姆斯借助唯物主义和辩证法来“解决”社会基础与上层建筑之间的关系问题。威廉姆斯认为,所有的社会系统和社会子系统都存在一个相同的经济时刻:人们在交往过程中产生社会性。交往是社会和社会性的社会生产与再生产过程。与此同时,每个社会系统和社会子系统又具有一个不相同的时刻:他们是突发性的、非经济性的。 十一,意识形态和拜物教构成了马克思之当代意义的第十一个维度。在商品拜物教中,“人们自己的一定的社会关系”,采取了“物与物的关系的虚幻形式”。[14]在政治拜物教中,国家是神化物:民族主义是构建虚构的种族的意识形态。[15]在传媒领域,广告业膜拜商品形态,主导意识形态的报刊新闻业膜拜统治和剥削。我们见证了针对移民劳工和难民的新民族主义和仇外心理的兴起。为了转移人们对阶级矛盾的关注,在民族主义的描述中,资本和劳动互不矛盾,且统一在一个“国家”中。马克思在分析独裁主义的过程中提出了“波拿巴主义”这一概念,即通过复兴所有民族荣耀的幻想来团结所有阶级的意识形态工程。 十二,马克思是批判性新闻记者和批判性知识分子的楷模。 十三,马克思强调社会斗争对建设美好社会的重要性。马克思的人文主义是务实的。他谈道,绝对命令就是“必须推翻使人成为被侮辱、被奴役、被遗弃和被蔑视的东西的一切关系” [16]。今天,还有关于数字技术作为社会斗争工具的作用的讨论。 十四,马克思强调,需要建立一个超越利润驱使、关注人类合作的社会制度。 三、大数据资本主义 大数据资本主义的兴起处在更广阔的社会、经济、政治、意识形态背景下。在经济上,资本主义国家经历了包括数据和通信在内的(几乎)所有东西的新自由主义的商品化和私有化;在政治上,已经出现了政府监视与大工业相结合的“监视—工业联合体”(surveillance-industrial complex),伴随着这一联合体而来的是宣扬监视技术将预防、侦破犯罪和恐怖主义活动的意识形态。监视性意识形态有助于形成控制、散布恐慌、寻找替罪羊、相互猜忌竞争、个性化的文化氛围。 对大数据的收集、存储、控制和分析因为受到了政治经济利益的驱使,其目的是实现对个人的经济和政治掌控。作为被监视目标的个人,既被视为消费者,又被视为潜在的罪犯或恐怖分子。爱德华·斯诺登(Edward Snowden)揭露了全球通信监控系统的存在,指出美国特工部门使用该系统实时监视和分析通信信息。卷入此监视系统的公司包括美国在线(AOL)、苹果(Apple)、脸书(Facebook)、微软(Microsoft)、网络电话(Skype)和雅虎(Yahoo!)等。 查尔斯·赖特·米尔斯(Charles Wright Mills)在1956年就曾指出:“经济、军事和政治结构之间的联系日益紧密。” [17]在此背景下,他还谈到了权力精英的存在。如今,权力精英利用“监视—工业联合体”来进行管控。在这个联合体的管控之下,用户在网络上的数据信息处于公开或半公开状态。大型公司将这些用户的数据和活动信息商品化以积累资本。特工部门和警方的目标是获得大数据的访问权,以确保数据和社会的安全。在操作过程中,他们又将部分监视工作外包给了私人安保公司。对这些公司来说,监视是一项有利可图的业务。美国国家安全局(NSA)将监视工作分包给了2000多家私人安保公司。在“监视—工业联合体”中,监视资本与监视政府融为一体。由此,大数据带来了大政府独裁和大资本主义企业。 关于监视性劳动,马克思曾谈到过“管理、监督和调节的职能”如何成为资本的职能。[18]米歇尔·福柯(Michel Foucault)指出,“我们生活在一个全景敞视主义主宰的社会” [19],并辩称,“全景机制主要是将个人置于双眼、注视、监视的中心,使他能够对权力机器范围之内的所有个体行使主权监管” [20]。“监视—工业联合体”表明,“马克思和福柯在权力概念上是有重合的”,“资本和权力已融为一体”,而且“两股相互矛盾又不具传递性的力量被迫联合并形成交叉”。[21] 监视研究领域的一些学者声称,监视已成为后全景,数字监视并未形成数字全景。他们还强调监视已去中心化,并声称福柯的全景敞视主义在理论上应该被瓦解。这一视角忽视了监视技术去中心化后的中心主义的出现。去中心化的监视技术在许多地方收集大数据,这些数据是网络化的,被资本和国家这两大全景式核心集团所掌控。 大数据资本主义和算法的力量可能导致整个世界变成一个巨大的购物中心,人们成为无孔不入的商业广告的标靶,整个社会被商业逻辑所主宰。在大数据的世界,利用工具逻辑计算人类需求的算法可以通过自动计算出人们的活动和决定来满足人们的需求。问题是,算法和机器没有伦理和道德。数据商品化不但意味着新的社会不平等的出现,还加剧了互联网的剥削倾向。大数据导致数据所有权与数据掌控权之间形成了“大数据鸿沟”。大数据还具有新型的理性歧视(rational discrimination)和累积劣势(cumulative disadvantage)的特征。基于数字实证主义的逻辑,大数据忽略了技术不能解决社会和政治问题的弊端。大数据监视的绝对怀疑逻辑废除了无罪推定,取而代之的是一种有罪推定,即人们在被证明无辜之前,都可能是罪犯或恐怖分子,尽管恐怖分子大多不会在网上交流他们的犯罪计划。京特·安德斯(Günther Anders)强调了监视的极权性特征:“随着监控设备使用的日常化,极权主义的重要前提已经产生,随之而来的是极权主义本身。” [22]监视和监视性的思想意识常常被嵌入到法律和政治秩序中,从而推动了法西斯主义的潜在发展。 大数据研究的兴起还导致了计算社会科学和数字人文等新的研究领域的出现,这些都体现了大数据实证主义的兴起。上述研究痴迷于量化研究,获得了大量的资助。大数据分析会带来社会科学研究方法向自然科学研究方法靠拢、人类社会被物化的风险。[23]大数据实证主义是“脱离哲学的科学” [24]。计算机科学主宰了社会科学和人文科学,其危险在于计算社会科学会导致理论的死亡,根除批判性的定性研究和理论导向研究。关于这一点,卢卡奇曾发出过警告:数学和实证主义将质量简化为“可以计算”的数量,并将人类行为物化。统筹大数据的数字机器创造了物化的新形式,摧毁了定性、辩证、批判和非工具性行为等概念。我们需要大数据分析的替代方案,需要批判性的数字媒体研究,而不是计算社会科学。 四、数字劳动的矛盾 2016年,谷歌盈利195亿美元,成为全球第27大跨国企业。同年,脸书的注册收益高达102亿美元,成为全球排名第188位的大企业。但也并非所有的社交媒体公司都有如此高的盈利。推特(Twitter)报告其在2016年亏损4.569亿美元。在美国经济中,利润占国民生产总值的比重为24.8%,占工资总额的53.1%。脸书的工资份额(即从企业收益中所支付的工资份额)为11%。为什么这家公司的工资与美国经济总量相比如此之低,而企业利润又那么高呢?这是因为,社交媒体经济是建立在剥削用户的无偿数字劳动的基础之上的。马克思用以下的公式描述了资本的积累周期:M—C……P……C'—M' 在社交媒体经济中,这一循环转变为:  社交平台是产品(P1),不是商品,它是“免费午餐”。个人数据(P2)是由用户的数字劳动所产生的商品,这一商品被出售给了广告商,广告商再基于其购得的用户个人数据有针对性地向其投放广告。 安东尼·奈格里(Antonio Negri)认为,我们需要“一种把劳动价值作为公共潜能的新理论”。马克思强调,技术和资本主义的发展导致了集体劳动者的出现:“随着劳动过程的协作性质本身的发展,生产劳动和它的承担者即生产工人的概念也就必然扩大。为了从事生产劳动,现在不一定要亲自动手;只要成为总体工人的一个器官,完成他所属的某一种职能就够了。” [25]马克思还把集体劳动者称为“总体工人”:“越来越多的劳动类型被直接纳入生产劳动的概念范围,从事生产劳动的人被定义为生产工人,即直接受资本剥削并从属于生产和扩张过程的工人。” [26] 马克思认为,劳动具有协作性这一特点需要进一步扩展生产劳动的概念。无偿劳动时间与对商品生产和资本积累做出贡献的无偿劳动一样,都同具有生产性和剥削性的雇佣劳动有关。自治主义理论、社会主义女性主义理论、受众劳动理论分别表达了这一洞见。 在自治主义理论中,社会劳动者这一“新的工人阶级”的概念“现在已经扩展到了整个生产和再生产的过程中”,实现了“生产劳动与再生产劳动之间的相互联系”。[27]社会主义女性主义主要针对的是一个普遍的假设,即“女性的家务劳动并非生产性劳动” [28]。此假设否定了“女性潜在的社会力量”。家庭劳动和生育劳动“不仅创造使用价值,而且对剩余价值生产至关重要”,它生产出“资本主义独有的商品:有生命的人——劳动者自身”。[29]达拉斯·斯麦兹(Dallas Smythe)的受众劳动理论认为,受广告资助的媒体的受众是无偿的受众劳动者,他们创造受众商品。“垄断资本主义社会的现实情况是,大多数人在睡眠之外的时间都是工作时间。……下班之后,最大的一整块时间就是受众时间,它被卖给了广告商。” [30] 商业社交媒体上的数字劳动在某些方面不同于商业广播媒体上的受众劳动。社交媒体基于大数据向用户定向投放广告,广播媒体受众只是从中获取信息。社交媒体用户还可以创建社会关系、内容和数据。用户在社交媒体上的数字劳动建立在消费(生产性消费)、对个人数据的持续监视、有针对性的个性化广告、预测算法和算法拍卖等基础之上。脸书和谷歌是全球最大的广告代理商,它们从数字劳动和用户信息的大数据商品中获利。 2015年,美国工人人均每周的再生产劳动时间为44.53小时。年平均雇佣劳动时间为1778小时,共完成总量为2320亿小时的雇佣劳动,其中剩余劳动时间为1130亿小时,必要劳动时间为1190亿小时。传统意义上,剩余价值率计算的是雇佣劳动的剩余劳动时间(s)与必要劳动时间(v)的比率。从货币入手,计算的是年度利润总额(p)与工资总额(v)的比率。以美国经济为例,按传统方法计算出来的2015年的剩余价值率为0.942,但传统计算公式没有把非雇佣劳动计算在内。据统计,2015年美国无偿再生产劳动时间共计5790亿小时。劳动的有机构成(修正后的剩余值率)可按如下公式计算:  资本的这种效应不仅增加了雇佣劳动的无偿劳动时间,还增加了非雇佣劳动的无偿劳动时间。再生产劳动之所以有生产力缘于它是由无偿的剩余劳动时间构式。资本剥削雇佣劳动和再生产劳动。2015年,美国劳动力的有机构成为:(579+113)/119=5.8。每小时的雇佣劳动要完成5.8小时的无偿再生产劳动。再生产劳动占所有无偿劳动时间的83.7%,占劳动力剩余劳动时间的16.3%。 2015年,美国的平均再生产劳动时间为每人每周44.5小时。平均而言,4.9小时用于观看广告,12.4小时用于使用商业社交媒体。受众劳动和用户的数字劳动构成了再生产劳动时间的巨大份额。而且,再生产劳动是性别化的。在美国,女性平均承担了60%的再生产劳动。脸书的算法依据种族主义和性别歧视的逻辑,使用粗略区分、总体概括和预先假设的方法来分割市场数据。来自贫穷国家的用户和总体上较贫穷的用户被视为价值较低的消费者——在点击广告时不大可能购买该广告商品。 数字资本主义在加剧剥削的同时,也为超越资本主义逻辑的自治领域创建了新的基础。数字资本主义为萌发于资本主义内部的新型生产关系奠定了基础。伴随着数字化的发展,“商品变得越来越透明”,“开始出现对社会合作的自主性和无产阶级主体的自我价值稳定(self-valorisation)越来越敏感的部门”。[31]数字资本主义建立在由数字劳动创造的数字商品与数字共享化的对立之上。 开放存取的出版模式就是数字对抗(digital antagonism)的一个极好例证。开放存取在一定程度上是对学术出版公司的高利润率以及该行业的垄断趋势的回应。2016年,里德·爱思唯尔(Reed Elsevier)集团税前净利润为19.34亿英镑,收入为68.95亿英镑,利润率为1.934/(6.895-1.934)=39%。同年,施普林格(Springer)出版集团获利2.964亿欧元,营业收入为8.331亿欧元,利润率为296.4/(833.1-296.4)=55.2%。这样的利润率是极高的。它们是通过向图书馆高价售卖文章订阅、数据库和期刊资源,以及向个人出售内容访问权限来实现的。 大学和其他学术机构都在很大程度上依赖公共资金。学术知识属于共有资源,它“部分地以今人的协作为条件,部分地又以对前人劳动的利用为条件” [32]。垄断资本将学术共有资源私有并商品化。开放存取则是对出版资本垄断的抵制。 “开放存取文献是数字化的、免费的在线资源,不受大多数版权和出版许可的制约。” [33]大多数开放存取项目是非营利性的,由学者或学术协会运营。少数项目是营利性的,通过文章和书籍的加工费来获取利润。 2017年3月20日,在《开放存取期刊名录》列出的9423种开放访问的期刊中,有3716种(39.4%)期刊不允许再用于商业用途,5134种(54.5%)期刊不收取论文编订费用。以上数据表明,存在独立于资本的数字学术共享空间。 人们对开放存取持有各种不同的政治立场。从政策和行业性角度来看,“开放式访问是一种伟大的新型商业模式”;从工会的视角看来,“开放存取由志愿性的非资源项目构成,这些项目毁坏了出版工人的工作”;而对开放存取持激进态度的人士则认为:“非营利性开放存取的出版形式需要与资本出版相抗争。” 劳伦斯与威沙特(Lawrence&Wishart)出版社是马克思和恩格斯文集的出版商。马克思在线档案馆(MIA,http://eproxy2.lib.tsinghua.edu.cn:80/rwt/CNKI/https/P75YPLUNMF3HR4LUPS3T655TM6VB/是一个开放存取经典马克思文本的在线图书馆,免费提供马克思和恩格斯的经典著作。2014年,劳伦斯与威沙特出版社与马克思在线档案馆之间就马克思和恩格斯的作品是否应该提供在线公开访问产生了冲突。 劳伦斯与威沙特出版社辩称:“在线档案馆对版权的侵犯夺走了小型出版商赖以维持的资金。(在线档案馆)所展现的并非是源于社会主义或共产主义传统下的规范或期望,而是一种期望将文化内容免费提供给消费者,并使出版商、编辑和作家等文化工作者无偿工作的消费文化。”马克思在线档案馆对此表示反对,认为网络是“信息的新媒介”。具体而言,工人运动的历史应该是“免费的”。包括马克思在线档案馆在内的任何共产主义出版社,他们所信奉的观点都是要确保这些著作得到最广泛的传播,而非对其进行限制,否则就是与共产主义出版的目标相违背。 冲突发生在拥护数字共享的左翼与支持数字版权的左翼之间,体现了网络数字生产力与资本主义内部另类项目运作之间的矛盾。免费在线提供马克思和恩格斯的著作不仅是经济问题,也是政治问题。出于政治原因,这些著作应该可以免费在线访问。访问权的广泛开放是使马克思主义思想成为物质力量的良好基础,而互联网是实现这一任务的绝佳媒介。由于“史翠珊效应”(Streisand effect),互联网上的版权保护措施取得的效果往往适得其反。左翼项目之间的竞争对自身不利。左翼之间应该加强合作,以挑战营利性的企业出版方。这些合作可能还需要努力争取和发展其他形式的资助,比如公共资助、捐赠、商业再利用收费、捐赠达到特定金额就实行免费公开访问等。 五、数字资本主义的危机 保罗·梅森(Paul Mason)将马克思的利润率下降趋势定律、约瑟夫·熊彼特(Joseph Alois Schumpeter)的长波理论与数字媒体分析结合起来,提出了资本主义崩溃的理论。这是亨利克·格罗斯曼(Henryk Grossmann)的资本主义崩溃理论在数字时代的新版本。格罗斯曼曾认为:“由于利润总额的相对下降,资本主义制度的崩溃将不可避免。” [34]梅森写道,信息技术导致信息的边际成本为零。其结果是,利润率将会不断下降,直到资本主义崩溃、后资本主义出现。 这种分析忽视了阶级斗争对利润率和剩余价值的影响。马克思的利润率计算公式如下:  通过将分数的分子、分母同除以可变资本,我们将其转换为以下形式:  剩余价值率衡量劳动剥削程度,资本有机构成衡量生产技术和资源强度。自1970年代以来,计算机化对利润率核算所产生的影响是矛盾性的。计算机提升了资本的有机构成和剩余价值率,但这两种比率对利润率有着相互矛盾的影响:有机构成的提升降低了利润率,而剩余价值率的上升又提高了利润率。资产阶级与工人阶级之间的斗争降低了工资份额(工资在国民生产总值中所占的份额)。总的结果是,在全球范围的许多国家总利润率产生了波动,这种波动又推动了金融化的发展,加剧了经济的不稳定性。工资的相对下降导致了家庭债务的增加和购买力的减弱。2008年的危机就是新自由主义的金融资本主义矛盾累积的体现。自此,世界上许多地区的经济危机演变成了自由主义的意识形态危机。 六、当今的意识形态 商品生产者之间并不直接相联。交换价值是指特定数量x形式的商品A与y形式的商品B交换(例如1根香蕉=0.15英镑)。生产关系是隐藏在生产和购买的商品之中的,这就是马克思所说的商品拜物教。商品是“社会的象形文字”[35]。“意识形态的出现和传播是阶级社会的普遍特征。” [36] 民族主义是一种崇拜国家的意识形态。民族主义掩盖了阶级关系,它表明资本和劳动是由(虚构的)国家利益联合起来的。“国家和国家地位是法西斯政治话语的核心组成部分。” [37]“法西斯主义本身应该被理解为一种政治商品:……对集体身份的盲目迷恋掩盖了商品的本质属性。” [38]法西斯主义是“一种民粹主义的意识形态,它试图通过统一和身份认同的神话在资产阶级和无产阶级群体之间投射出‘共同的自然命运’(common instinctual fate),从而抹杀社会阶层的分化和不同阶层间的实际差别” [39]。资本主义危机会产生法西斯主义,所以我们不能排除新的民族主义变成新的法西斯主义并引发新的世界大战的可能。 以唐纳德·特朗普(Donald Trump)为例,他不仅是一名政客和资本家,还是一位利用推特和真人秀节目传播意识形态并自我标榜的媒体名人。社交媒体是一个争斗的场所,涉及符号、交往和意识形态等方面。在信息时代,网络传播领域是阶级斗争的重要领域。特朗普在推特上拥有3000多万粉丝,在脸书上获得了2000多万个赞,在照片墙(Instagram)上有700多万粉丝。他将社交媒体作为传播其政治观点的工具。 2016年9月5日是美国庆祝劳动节的日子。特朗普在推特和脸书上发布了其对美国工人演讲的视频[40],他在视频中说道: 美国工人为我们今天热爱并拥有的国家奠定了基础,但是美国工人正在被压垮。诸如北美自由贸易协议(NAFTA)和跨太平洋伙伴关系协定(TPP)之类的不良贸易交易对雇用了如此多优秀美国民众的小型企业来说,是一笔高昂且不可宽恕的税费。在劳动节这一天,让我们向美国工人致敬,向那些自豪地让美国继续运转的男男女女致敬。他们绝对是全世界最优秀的,没有人可以与他们媲美。我将让美国再次就业,并使美国再次伟大。这就是我们在11月8日要做的事情。 这段演讲包含了几处意识形态元素。他把美国和美国人塑造成神话般的集体,并在资本与劳动之间建构起统一的民族利益。特朗普把美国描绘成正在遭受外敌攻击的国家,社会冲突被描绘为国家之间的冲突,从而转移了人们对阶级冲突的关注。特朗普对推特的使用清楚地表明了民族主义是如何作为政治拜物教发挥作用的。罗莎·卢森堡(Rosa Luxemburg)认为,民族主义是“一再掩藏历史真相”的“模糊的面纱”。[41]“热血、群体、民众才是隐藏实际权力集聚的手段。” [42] 七、替代方案 21世纪正在进入一个历史分岔点,其特征是动荡和政治两极化的加剧。未来是不确定的。我们可能走向超级新自由主义资本主义、独裁资本主义、法西斯主义,在一场核世界大战中彻底毁灭地球和人类,或是替代上述预案,走向共同体社会(society of the commons)。究竟谁占主导取决于社会斗争将如何发展。事实上,卢森堡在1918年曾写下的真理在今天再次变得异常急迫:“在这个时刻,社会主义是人类唯一的救星。” [43] 右翼独裁主义运动推动了自然、社会和交往这些特殊政治的发展。关于自然,右翼独裁者迷恋民族认同、家庭和守旧传统,把移民和全球认同视为扰乱民族国家的环境问题;关于社会,右翼独裁主义的社会政策既支持鼓吹适者生存价值观念的新自由主义意识形态,又拥护保留福利给本土民众的民族社会主义主张;关于交往,右翼独裁主义一方面联合保守的技术悲观主义,认为传统的价值观念会受到互联网的威胁,从而主张对互联网实施法制管控,另一方面,他们又倡导新自由主义和技术资本主义意识形态,为媒体企业和互联网企业欢呼。 今天的进步力量大多是分裂的、支离破碎的。共同体包含社会共同体、自然共同体和社交共同体。这些共同体都已经变得越来越商品化和私有化。左翼政党和左翼运动要为捍卫社会共同体而奋斗,绿色运动要为捍卫自然共同体而奋斗,技术运动则要为捍卫交往共同体而奋斗。为了挑战右翼独裁主义,进步力量应该从1920年代左翼的失败中汲取教训。当时各派别、尤其是社会民主党人和共产主义者之间彼此对立,没有团结起来对抗法西斯主义的威胁。我们需要形成团结统一、反对右翼独裁主义的政治统一战线,需要把捍卫社会、自然和交往共同体的活动同形成统一进步党派和组织其他进步运动紧密结合。社会民主需要更新为社会民主2.0的形式,是一项为社会主义民主和民主社会主义而奋斗的运动。为了应对资本与右翼独裁主义的融合,唯一可行的办法就是左翼与国际主义进步运动相融合。 关于交往,共同体社会的视角主张推动数字共享、平台合作与公共服务互联网的发展。民主交往的形成塑造了“一个自由人联合体,他们用公共的生产资料进行劳动,并且自觉地把他们许多个人劳动力当作一个社会劳动力来使用” [44],这个联合体又反过来促进了民主交往的形成。 弗朗兹·诺伊曼(Franz L.Neumann)曾强调,面对危机,学者们作为批判性知识分子的作用非常重要,“我们既作为国家公民又作为大学的一员,面临着贩卖焦虑和践踏自由的双重冒犯,这既来自教育领域,又来自国家政治层面。政治对我们而言具有双重性:一是政治问题渗透到学术研究领域,二是应对政治问题所采取的立场。如果我们严肃对待政治的人性关怀,如果我们希望防止蛊惑民心的政客制造焦虑和冷漠,那么作为老师和学生的我们一定不能保持沉默。……我们必须发声、写作” [45]。
回应 2021-01-17 19:08 -
-
朝歌暮清酒 (庆幸是一个有情有意的人。)
摘录: - 您在位置 #14-15的标注 | 添加于 2018年10月15日星期一 上午7:58:46 随着智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。 - 您在位置 #26-28的标注 | 添加于 2018年10月15日星期一 上午7:59:22 一旦“不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系”,“思维转变过来,数据就能被巧妙地用来激发新产品和新型服务”。 - 您在...2021-01-08 14:11
摘录:
- - 您在位置 #14-15的标注 | 添加于 2018年10月15日星期一 上午7:58:46
随着智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。
- - 您在位置 #26-28的标注 | 添加于 2018年10月15日星期一 上午7:59:22
一旦“不再追求精确度,不再追求因果关系,而是承认混杂性,探索相关关系”,“思维转变过来,数据就能被巧妙地用来激发新产品和新型服务”。
- - 您在位置 #275-276的标注 | 添加于 2018年10月15日星期一 上午8:03:25
大数据是人们获得新的认知、创造新的价值的源泉;大数据还是改变市场、组织机构,以及政府与公民关系的方法。
- - 您在位置 #348-350的标注 | 添加于 2018年10月15日星期一 上午8:12:38
人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度则比世界经济的增长速度快9倍。难怪人们会抱怨信息过量,因为每个人都受到了这种极速发展的冲击。
- - 您在位置 #415-415的标注 | 添加于 2018年10月15日星期一 下午2:25:32
大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,Facebook知道我们的喜好。
- - 您在位置 #562-567的标注 | 添加于 2018年10月15日星期一 下午2:37:44
实际上,大数据与三个重大的思维转变有关,这三个转变是相互联系和相互作用的。 ●首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。 ●其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。 ●最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。
- - 您在位置 #856-858的标注 | 添加于 2018年10月15日星期一 下午2:48:38
在不断涌现的新情况里,允许不精确的出现已经成为一个新的亮点,而非缺点。因为放松了容错的标准,人们掌握的数据也多了起来,还可以利用这些数据做更多新的事情。
- - 您在位置 #962-963的标注 | 添加于 2018年10月15日星期一 下午6:13:10
谷歌的翻译之所以更好并不是因为它拥有一个更好的算法机制。和微软的班科和布里尔一样,这是因为谷歌翻译增加了很多各种各样的数据。所以会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误。况且,它也没有详细的人工纠错后的注解。但是,谷歌语料库是布朗语料库的好几百万倍大,这样的优势完全压倒了缺点。”
- - 您在位置 #1148-1150的标注 | 添加于 2018年10月15日星期一 下午6:24:33
只要我们能够得到一个事物更完整的概念,我们就能接受模糊和不确定的存在。就像印象派的画风一样,近看画中的每一笔都感觉是混乱的,但是退后一步你就会发现这是一幅伟大的作品,因为你退后一步的时候就能看出画作的整体思路了。
- - 您在位置 #1342 的笔记 | 添加于 2018年10月15日星期一 下午6:36:20
淘宝 猜你喜欢 收藏 购物车网易云音乐 每日推荐网易严选 邮件 - 您在位置 #3119-3120的标注 | 添加于 2018年10月22日星期一 下午7:41:39大数据还会带来更多的威胁,毕竟,大数据的核心思想就是用规模剧增来改变现状。除了对隐私和倾向的不良影响,大数据还有一个弊端。我们冒险把罪犯的定罪权放在了数据手中,借以表达我们对数据和我们的分析结果的崇尚,但是这实际上是一种滥用。
回应 2021-01-08 14:11
论坛 · · · · · ·
读书笔记和思考 | 来自手账er-Lily | 2020-05-12 | |
求豆友看看有没有遇到这个问题-hdfs启动异常 | 来自繁星 | 2019-09-13 | |
云计算的运用 | 来自祝英台近 | 2019-09-06 | |
英文原版epub,分享给大家 | 来自台台以台 | 8 回应 | 2019-09-06 |
关于大数据预测未来的几个可能性疑问 | 来自自由妄想者 | 1 回应 | 2019-08-20 |
> 浏览更多话题
当前版本有售 · · · · · ·
-
【Q4AVZU】新人(满64-15包邮)
-
全场一本包邮
购买二手书 · · · · · ·
这本书的其他版本 · · · · · · ( 全部5 )
-
Eamon Dolan/Houghton Mifflin Harcourt (2013)7.6分 286人读过
-
天下文化 (2013)7.7分 28人读过
-
Hodder & Stoughton (2013)7.6分 33人读过
-
John Murray (2013)暂无评分 3人读过
在哪儿借这本书 · · · · · ·
以下豆列推荐 · · · · · · ( 全部 )
- IT好书100本 (左神神)
- 12年的科技商业书单 (PL)
- 生而有涯 书海无涯 (以实玛利)
- 金融博物馆书院2013年7-9月推荐书单 (金融博物馆书院)
- 25位创业和投资圈阅读达人推荐的50本年度好书 (汪小天Will)
谁读这本书?
二手市场
订阅关于大数据时代的评论:
feed: rss 2.0
19 有用 夏一慕 2013-04-07
不是精确,而是关联;不求因果,只为预测。读完之后只愿意给三星了,废话太多,实质性的逻辑思辨内容太少,如果是要我看大数据的道理,第一章就够了。也许本书标题的意义大于内容。
151 有用 A 2013-04-17
这本书的内容 用20页的PPT 完全就可以讲完了。。。。。。。。。。。
3 有用 古道 2013-07-14
从书籍组织、构架、涉及内容角度来说,至少个人认为不值得被评价为四星,但是对于我来说,这是第一本大数据方面的书籍,因此很有启发性,姑且评价为四星推荐吧。
5 有用 左思 2013-09-09
2013-09-09读毕,这本是关于大数据对社会、生活思维影响的一本书,写作思路浅显易懂,重点介绍了谷歌在图书电子化;用验证码来帮助识别不易识别单词(扫描电子化的图书);亚马逊用大数据进行有针对性的广告;超市监控录像不只是监督员工、防盗,更重要的功能是发现消费者的偏好;GPS(手机、导航)可以帮助形成广告和房地产价格等。最后作者也提到最大的大数据应该是来自于人,比如发明适当的程序跟踪患者的健康,所... 2013-09-09读毕,这本是关于大数据对社会、生活思维影响的一本书,写作思路浅显易懂,重点介绍了谷歌在图书电子化;用验证码来帮助识别不易识别单词(扫描电子化的图书);亚马逊用大数据进行有针对性的广告;超市监控录像不只是监督员工、防盗,更重要的功能是发现消费者的偏好;GPS(手机、导航)可以帮助形成广告和房地产价格等。最后作者也提到最大的大数据应该是来自于人,比如发明适当的程序跟踪患者的健康,所形成的数据一是具有研究价值,另外也可以为改善患者健康做出巨大贡献。 (展开)
6 有用 潘驴邓小仁波切 2014-07-23
信口开河,胡说八道。
0 有用 米斯特靠谱 2021-01-19
相关性并不意味着有因果关系。大数据时代更需要探索数据相关性,不苛求因果。人也一样,但行好事,莫问前程!
0 有用 王更生// 2021-01-18
为了完整性,例了太多例子。内容尚可。
0 有用 K村小北 2021-01-17
这本书为我更好的理解世界打开了一扇新的大门,让我深感“the more you know,the less you know",也让我更加坚信我对后半生的道路选择是对的。
0 有用 骑摩托车兜风去 2021-01-17
世界从探求因果关系变成挖掘相关关系 在宏观领域起作用的方法在微观领域失去了作用 大数据是指不用随机分析这样的捷径,而采用所有数据的方法。如谷歌流感趋势和乔布斯的医生们 “大数据基础上的简单算法比小数据基础上的复杂算法更加有效”,“混杂是关键” 相比依赖于小数据和精确性的时代,大数据更强调数据的完整性和混杂性。 接受混乱与不确定性 “如果凡事皆有因果的话,那么我们就没有决定任何事的自由” 因果关系只... 世界从探求因果关系变成挖掘相关关系 在宏观领域起作用的方法在微观领域失去了作用 大数据是指不用随机分析这样的捷径,而采用所有数据的方法。如谷歌流感趋势和乔布斯的医生们 “大数据基础上的简单算法比小数据基础上的复杂算法更加有效”,“混杂是关键” 相比依赖于小数据和精确性的时代,大数据更强调数据的完整性和混杂性。 接受混乱与不确定性 “如果凡事皆有因果的话,那么我们就没有决定任何事的自由” 因果关系只是特殊的相关关系 鼓励我们放弃理论,而是关注于数据本身 计量与记录一起促成了数据的诞生 “预测给我们知识,而知识赋予我们智慧和洞见” 用户交互的碎屑实际上是金粉,收集在一起就能锻造成一块善良的金元宝 “匿名化”对大数据的无效性 大数据提供的不是最终答案,只是参考答案 预测未来最好的办法就是创造未来 (展开)
0 有用 小李光头 2021-01-16
我挺喜欢书里对相关性所采取的态度的,在最大化利用已知的基础上探索更多未知。