出版社: 中信出版社
副标题: 数学杀伤性武器的威胁
原作名: WEAPONS OF MATH DESTRUCTION: How Big Data Increases Inequality and Threatens Democracy
译者: 马青玲
出版年: 2018-9-1
页数: 320
定价: 69.00元
装帧: 精装
ISBN: 9787508692067
内容简介 · · · · · ·
数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。
我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。
但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。...
数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。
我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。
但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿,有时甚至是落井下石。
通过个案追踪,凯西•奥尼尔揭示了大数据是如何影响我们将来的,它不仅影响着个人,也影响着整个社会。这些数据评价着我们的老师、学生,筛选着我们的简历,审核着我们的贷款资格,衡量着员工的工作态度,监视着投票者,监控着我们的健康。
凯西•奥尼尔呼吁数据模型的创造者们要对算法负责,政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后,作者指出,大数据几乎掌控着我们的生活,我们应该增加对它的了解。这本书相当的重要,它让我们有能力去问一些十分尖锐的问题,帮助我们了解事实的真相,提出需要改变的地方,探索更好的生活。
【编辑推荐】
案例丰富,内容兼具深度与话题性
未来20年,算法和大数据将席卷世界,接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务,数据伦理的价值和意义将不断凸显出来。在作者看来,大数据犹如一个黑盒,规模、伤害和隐秘共存,她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例,并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为,数据和算法的关系就像枪械和军火,数据没有价值观,是中立的,但来自人类行为的输入,难免隐含偏向,而算法创造的数据又对人类行为产生反作用,从而导致更多的不公。凯西在书中指出:算法模型一旦运转,执法行为就会增多,产生的新数据又会进一步证明加强执法的必要性。形象地说,就是哪里“前科”越多,哪里就越受算法“关照”,最终形成一个失真,甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选,国内很多专家学者热议“今日头条”推送模式的核心所在。
权威作者的深刻洞见
本书作者是哈佛大学的数学博士,研究方向是数论和代数几何,毕业之后在麻省理工学院执教,并在互联网公司做过很长时间的数据科学家,如今致力于教育和媒体行业的数据知识普及工作,因此,这并不是一本传统意义上唱衰大数据的书,相反,作者希望让更多的人通过了解大数据、了解算法,反思模型,以及通过政府和相关机构的合理监管,不断改善各类设计评价体系,让更多的人受益,维护社会的公平与民主。
【英文版获奖情况】
《纽约时报》(New York Times)年度书籍
《波士顿环球报》年度最佳图书
《连线》杂志年度必读书目之一
《财富》年度最受欢迎的书之一
《柯克斯评论》年度最佳作品
芝加哥公共图书馆年度最佳图书
《自然》网站年度最佳图书
《麻省理工科技评论》年度最佳科技图书
作者简介 · · · · · ·
凯西•奥尼尔(Cathy O'Neil)
数据科学家,mathbabe.org的博主。博士毕业于哈佛大学,主修数学专业。她曾在巴纳德学院任教,之后为私营企业服务,例如避险基金。她还在各类新型公司担任数据科学家,预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。
目录 · · · · · ·
第一章 盲点炸弹
不透明、规模化和毁灭性
第二章 操控与恐吓
弹震症患者的醒悟
第三章 恶意循环
排名模型的焦虑和杀伤性的对立面
第四章 数据经济
掠夺式广告的赢家
第五章 效率权衡与逻辑漏洞
大数据时代的正义
第六章 筛选
颅相学的偏见强化
第七章 反馈
辛普森悖论的噪声
第八章 间接损害
所有数据都是信用数据?
第九章 “一般人”公式
沉溺与歧视
第十章 正面的力量
锁定微目标的出发点
结束语
注释
索引
· · · · · · (收起)
原文摘录 · · · · · · ( 全部 )
-
出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂,为了“优化招生”,教育咨询产业兴起了。 教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(Forecast Plus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(Right Student)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选,包括可以支付全额学费的学生,以及可能有资格获得校外奖学金的学生。就这个意义而言,学习障碍对于大学录取可能反而是个优势。 …… 教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼,是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生,计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示,假设一个美国高中生的平均学分绩点(GPA)为3.8,SAT成绩为2000分,课外活动时间为800小时,那么他被纽约大学录取的概率为20.4%,被南加州大学录取的概率为28.1%。然后,星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并... (查看原文) —— 引自章节:排名模型的焦虑和杀伤性的对立面 -
在研究数学杀伤性武器的时候,我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如,宪法就假定一个人是清白的。站在建模者的立场,无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉,而这又会消耗大量的时间和资源。因此,我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小。 相反,数学杀伤性武器更倾向于效率。本质上,数学杀伤性武器建基于可测量和可计算的数据。但公平是模糊的,很难量化,它是一个抽象概念。我们的计算机程序尽管在语言学习和逻辑学习方面有所进步,但仍然不能很好地理解抽象概念。它们所理解的“美”只是一个与大峡谷、海洋日落和时尚杂志的美容美发相关联的词,它们试图通过计算脸书上的点赞数和关系网来衡量“友谊'”。而到目前为止,计算机还完全不理解公平这个概念。程序员不知道该如何为公平编码,他们的老板也很少会要求他的做这件事。 (查看原文) —— 引自第103页
> 全部原文摘录
喜欢读"算法霸权"的人也喜欢的电子书 · · · · · ·
喜欢读"算法霸权"的人也喜欢 · · · · · ·
算法霸权的书评 · · · · · · ( 全部 17 条 )

不公平的模型已经开始泛滥了
这篇书评可能有关键情节透露
《黑镜》第三季第一集的社会中,有一个评分体系。人们每时每刻都要对别人的行为进行打分,而评分是个人获取各种社会资源的凭证。工作、生活、身心健康无不依赖于它。剧情展示了生活在这种社会中的人的悲惨生活。 但现实中,已经有这种评分的类似物了。2016 年年底,支付宝依托... (展开)
观点并不新颖,消遣可以看看
这篇书评可能有关键情节透露
先写结论:作者对数据模型做了很好的总结,但是观点并不新颖。举例过于冗余,后半部分有点像在冲字数。一些观点过于偏激,比如全盘否定数据模型的在社科领域的作用。 作者对数据模型有几个不错的总结,罗列如下:1. 数据模型擅长以低成本处理海量数据,2. 由于人们无法对模型进... (展开)
自恋,自负,自私的,“神”
这篇书评可能有关键情节透露
现在的互联网世界,弥漫着一种“技术既正确”的气氛。高技术诚然引领了社会的经济增长,技术员也在这一波浪潮中赚了不少快钱。我没有要否定计算机技术的意思,但国内的氛围,似乎看不到对于技术的负面影响有什么怀疑。 这本书在国内出版的意义就在于此。 人类的技术正在做的,... (展开)> 更多书评 17篇
-
元非 (Fuck-up Artist)
教做题还得看华人 出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学...2020-06-13 16:05:58 6人喜欢
教做题还得看华人
出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂,为了“优化招生”,教育咨询产业兴起了。 教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(Forecast Plus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(Right Student)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选,包括可以支付全额学费的学生,以及可能有资格获得校外奖学金的学生。就这个意义而言,学习障碍对于大学录取可能反而是个优势。 …… 教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼,是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生,计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示,假设一个美国高中生的平均学分绩点(GPA)为3.8,SAT成绩为2000分,课外活动时间为800小时,那么他被纽约大学录取的概率为20.4%,被南加州大学录取的概率为28.1%。然后,星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并最终成功被纽约大学录取,则该学生就需向咨询公司支付25931美元,如果他最终成功被南加州大学录取,则需要支付18826美元。如果他的申请被两个学校都拒绝了,那么咨询公司将不收取任何费用。 每所大学的招生模型都全部或者至少一部分来源于《美国新闻》的大学排名模型,这些模型中的每一个都是一个小型的数学杀伤性武器。正是这些招生模型让学生和家长身陷焦虑,花掉大把的钱。而且这些招生模型都是不透明的,大多数的申请学生(或者叫受害学生)都被蒙在鼓里。这就为像马振翼这样的专业咨询人士创造了巨大的商机,通过培养其在各个大学的人脉以获取第一手信息或者逆向推导各个学校的招生模型算法,他们破解了绝大部分学校的招生模型。 引自 排名模型的焦虑和杀伤性的对立面 回应 2020-06-13 16:05:58 -
一锅脑浆粥 ([!^13]@>([;.\?\!][ ^13]))
这些程序和大学录取程序一样,其所造成的结果就是那些拥有充足的金钱和资源来准备简历的人脱颖而出。没有精心准备简历的人也许永远不会知道他们投递的简历已经早早被机器排除了。这个案例再一次生动地展示了有钱人和消息灵通的人能占据多大的优势,而穷人被判出局的可能性又有多高。 公平地说,筛选简历这件事总是会存在这样或那样的偏见。上一代求职者中的消息灵通人士会非常细心地把简历内容写得明晰连贯,用IBM(美国国际商...2019-01-19 20:18:47 3人喜欢
这些程序和大学录取程序一样,其所造成的结果就是那些拥有充足的金钱和资源来准备简历的人脱颖而出。没有精心准备简历的人也许永远不会知道他们投递的简历已经早早被机器排除了。这个案例再一次生动地展示了有钱人和消息灵通的人能占据多大的优势,而穷人被判出局的可能性又有多高。 公平地说,筛选简历这件事总是会存在这样或那样的偏见。上一代求职者中的消息灵通人士会非常细心地把简历内容写得明晰连贯,用IBM(美国国际商用机器公司)出品的高端电脑输入信息,再用优质打印纸打印出来。因为这样的简历获得招聘者认可的可能性更高。手写的简历,或者蹭上油印机器黑墨的简历通常都会被丢进垃圾桶。所以,从这个意义上来说,机会的不公平并不是什么新鲜事,只是现在不公平有了一个新的化身——自动化筛选程序。 这些自动化筛选程序的不公平操作不仅仅局限于筛选简历。我们的生计也越来越依赖于我们顺应机器的能力。最明显的例子就是谷歌。不管是连锁酒店还是汽车修理厂,一家企业的成功在很大程度上取决于它是否能够出现在搜索引擎的第一页。现如今,个人也面临着同样的挑战,不管是进入一家公司,向上晋升,还是只是逃过裁员浪潮,这一切的关键就在于了解筛选机器的判定标准是什么。可是,在这个被吹捧为公平、科学和民主的数字化世界里,仍然只有内部人士才能找到那条通往成功的路径。 引自 第六章 筛选 颅相学的偏见强化 公平?民主?不存在的。 被骗这么多年到现在了,还没清醒过来吗?
回应 2019-01-19 20:18:47 -
一锅脑浆粥 ([!^13]@>([;.\?\!][ ^13]))
在研究数学杀伤性武器的时候,我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如,宪法就假定一个人是清白的。站在建模者的立场,无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉,而这又会消耗大量的时间和资源。因此,我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是,相...2019-01-19 20:15:12 2人喜欢
在研究数学杀伤性武器的时候,我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如,宪法就假定一个人是清白的。站在建模者的立场,无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉,而这又会消耗大量的时间和资源。因此,我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小。 相反,数学杀伤性武器更倾向于效率。本质上,数学杀伤性武器建基于可测量和可计算的数据。但公平是模糊的,很难量化,它是一个抽象概念。我们的计算机程序尽管在语言学习和逻辑学习方面有所进步,但仍然不能很好地理解抽象概念。它们所理解的“美”只是一个与大峡谷、海洋日落和时尚杂志的美容美发相关联的词,它们试图通过计算脸书上的点赞数和关系网来衡量“友谊'”。而到目前为止,计算机还完全不理解公平这个概念。程序员不知道该如何为公平编码,他们的老板也很少会要求他的做这件事。 引自 第五章 效率权衡与逻辑漏洞 大数据时代的正义 资本就像癌细胞一样活着就是为了自我复制,见到如此高效率的工具简直要乐开花了。公平神马的?不存在的。
回应 2019-01-19 20:15:12 -
一锅脑浆粥 ([!^13]@>([;.\?\!][ ^13]))
正如大多数数学杀伤性武器一样,核心问题主要在于模型的目标。把目标由压榨大众变更为帮助大众,数学杀伤性武器的危险性就解除了,甚至可以反过来变成一种正面力量。 目标就是指挥棒这一点不假。 至于说把目标改变一下神马的,在眼下这个资本主义世界里,就别图样图森破了。2019-01-19 20:26:53 2人喜欢
-
【英子树读知识共享】 Ⅱ.案例S(定位之用) 我越来越担心技术模型与现实世界中的有血有肉的个体的相互分离的趋势,以及这种分离带来的道德影响。事实上,我在数据,科学领域看到了我在金融领域见到过的同样的模式:一种盲目的安全感导致的不安全模型的广泛应用,模型对于评估效果的自我定义,以及加速恶化的反馈循环。 那些复杂的算法被用于确保失败者保持失败者的角色,幸运的少数派将获得对数据经济的更多控制权,掠夺惊人的...
2019-03-22 12:30:46
【英子树读知识共享】 Ⅱ.案例S(定位之用) 我越来越担心技术模型与现实世界中的有血有肉的个体的相互分离的趋势,以及这种分离带来的道德影响。事实上,我在数据,科学领域看到了我在金融领域见到过的同样的模式:一种盲目的安全感导致的不安全模型的广泛应用,模型对于评估效果的自我定义,以及加速恶化的反馈循环。 那些复杂的算法被用于确保失败者保持失败者的角色,幸运的少数派将获得对数据经济的更多控制权,掠夺惊人的财富,并说服自己值得拥有这一切。 Ⅲ.金句P(定义之器) 期望值本身就是来源于数据的一个估计值,这相当于在猜测的基础上再猜测,其结果就是诞生一个会产生很多随机结果的模型,统计学家称之为噪声。 算法能从一个领域跳跃性的应用于另一个领域,而且经常如此。 Ⅳ.模型M(定向之术) 这种现象在统计学上叫辛普森悖论,即在某个条件下,两组数据在分别讨论时都满足了某种性质,可是一旦合并考虑,就可能导致相反的结论。 就像一个旅游网站一样,每一个人可以自行制定个人的模型,想想看:透明,用户控制,个人化——完全是数学杀伤性武器的对立面。 数学杀伤性武器共有三个特征:不透明,规模化,毁灭性。 Ⅴ.清单L(定性之法)
回应 2019-03-22 12:30:46 -
一锅脑浆粥 ([!^13]@>([;.\?\!][ ^13]))
然而,随着金融危机加l剧,德劭集团的合伙人开始担忧了。毕竟,所有的市场都是紧密联系在一起的——大家都是一条船上的人。当时,业内盛传雷曼兄弟已处在破产边缘,而雷曼兄弟持有德劭集团20%的股份,我们的很多交易都是交由雷曼兄弟处理的。由于市场持续动荡,德劭集团内部开始人心浮动。是,我们仍然可以用强大的模型处理大量的数据,但是,如果可怕的明天和之前的每一天都不一样了怎么办?要是明天的一切都变了呢? 这的确值...2019-01-19 20:08:35
然而,随着金融危机加l剧,德劭集团的合伙人开始担忧了。毕竟,所有的市场都是紧密联系在一起的——大家都是一条船上的人。当时,业内盛传雷曼兄弟已处在破产边缘,而雷曼兄弟持有德劭集团20%的股份,我们的很多交易都是交由雷曼兄弟处理的。由于市场持续动荡,德劭集团内部开始人心浮动。是,我们仍然可以用强大的模型处理大量的数据,但是,如果可怕的明天和之前的每一天都不一样了怎么办?要是明天的一切都变了呢? 这的确值得忧虑,因为数学模型的本质是基于过去的数据推测未来,其基本假设是:模式会重复。 引自 第二章 操纵与恐吓 弹震症患者的醒悟 没人能保证明天太阳还会从东边出来。
再往前十年,LTCM就是这么挂的:历史给人的唯一教训,就是人们从未在历史中吸取过任何教训。——这个模式倒是永远不会出错,呵呵。 (因为这不是模式而是元模式的缘故吧)
回应 2019-01-19 20:08:35
-
【数字难民的偏见瘟疫】 算法霸权这本书充满了反思性,相比于与之相似的波兹曼的《技术垄断》,更具有时代感,更贴近互联网时代的现状,读来也更有代入感,仿佛是专门写给这个时代。就如它开篇言简意赅又发人深省的那句话:献给数字难民。 数字难民的说法很有趣。在一个技术高度发达的和平年代里,难民这个词显得不大合时宜。但阅读完这本书之后,我不仅觉得这个词鞭辟入里,而且恰如其分。我们在数字时代窘迫、被动却不自知的...
2022-04-20 11:42:45
【数字难民的偏见瘟疫】
算法霸权这本书充满了反思性,相比于与之相似的波兹曼的《技术垄断》,更具有时代感,更贴近互联网时代的现状,读来也更有代入感,仿佛是专门写给这个时代。就如它开篇言简意赅又发人深省的那句话:献给数字难民。
数字难民的说法很有趣。在一个技术高度发达的和平年代里,难民这个词显得不大合时宜。但阅读完这本书之后,我不仅觉得这个词鞭辟入里,而且恰如其分。我们在数字时代窘迫、被动却不自知的状态与难民又有何区别呢?这种精神上的难民心态怕来得更令人恐惧。
书中分为十章,全面地分析了“数学杀伤性武器”的危害。探讨了棒球模型、家庭饮食模型、再犯模型中数学杀伤性武器的不透明、规模化与毁灭性。揭示了金融市场对冲基金、抵押贷款公司中数据应用所形成的操纵和恐吓。揭示了全美大学排名之类的排名模型带来的特权和焦虑。揭示了掠夺性广告导致的社会分层。探究了犯罪预测模型带来的效率权衡与逻辑漏洞。还揭示了人格测试、自动化筛选程序在工作环境中造成的偏见。还探讨了人力调度软件、教师评估模型造成的辛普森悖论。还通过分析信用评分模型、电子评分系统解释了替代变量如何造成了间接的损害。还揭示了保险行业、汽车保险行业、健康计划中的“一般人公式”及其带来的歧视,最后还分析了脸书算法与政治行为之间的暧昧关系。
作者对于数学杀伤性武器的批判,寥寥数语但切中要害。关于模型的广泛应用,作者说“错误总会出现,因为模型的本质就是简化。”、“一个模型的信息盲点能够反映建模者的判断和优先级序列。”、“模型正是用数学工具包装出来的各种主观观点。”、“模型一旦变成一种信仰,就从此固定下来了。”所以,我们“到底是彻底根除了人类偏见,还是只不过用技术包装了人类偏见?”
而对于我们赖以生存的金融市场而言,“数学能让谎言和骗局不断繁殖,但不能破译它。”、“拒绝承认风险的存在在金融领域已经根深蒂固。”、“一种盲目的安全感导致的不完整模型的广泛应用,模型对于评估效果的自我定义,以及加速恶化的反馈循环。”
再说到教育,教学评估的运用又总是背离创造时的初心,违背“高等教育是深化自我实现、扩大个人生产力和增加个人回报的途径”的目标。而对于那些贫穷的人,掠夺式广告又“以寻找不平等并大肆利用不平等为己任,其结果是进一步巩固了现有的社会分层。”进一步加大了穷人的苦难,因为“对于过一天是一天的人来说,痛苦是他们最大的驱动力。”
除此之外,“数学杀伤性武器会互相滋养、固化。同样的数学杀伤性武器既能压榨穷人,又能把社会富有阶层圈养在它们通过营销广告塑造的世界里。大数据程序只能将过去编入代码,而不会创造未来。创造未来需要道德想象力,而想象力只有人类才有。”
我如今再反思身处数字时代的我自己,只觉得四面楚歌、风声鹤唳。那些未曾被我们发现的错误,正在以一种难以预测的速度不断地扩大影响,带来个人观念上的狭隘、价值判断上的偏见和社会阶层的固化。对此我们浑然不知,并冠之以“科学”的标签高举和推崇。我们眼中的公平变成了偏颇的数据,我们心中的评判变成了冰冷的算法,个人的道德感与评判力正在渐渐化为乌有,一场场偏见的瘟疫正不断地扩散开来,这真是一场属于数字难民的灾难。
但如果我们再往深了想一想,数字时代真的就一无是处么?答案当然是否定的。数学模型的出现是进步的表现,是生活发展前进的标志,是为人类所用并能造福人类的产物。它不仅作用与人类的生活,还作用于人类自身。因为人类的大脑也在运行着内部模型,这些内部模型也往往内嵌着偏见或者利己主义。只不过,如今的它还处于幼稚的童年时代,少有权衡利弊和公正意识。但在它成长的过程中,我们要不断认识到数学模型应该是我们的工具,而不应该成为我们的主人。我们要反思与进步,通过一切努力阻断偏见的瘟疫,把我们从数字难民的群体中解放出来。等到我们可以自信地撇开这个身份,那必然是一个全新的更进一步的好时代,当时的我们回望现在,也许会像作者在后记中所写到的那样:“我希望,在我们学会如何为这个数据时代注入公平和问责之后,将来的人们在回忆起数学杀伤性武器时,会把它当作这场新革命的早期遗产,就像一个世纪前的致命煤矿一样。”
回应 2022-04-20 11:42:45 -
人力调度软件也制造出了一种恶性循环。想想前文中提到的单亲妈妈纳薇欧。因为工作时间非常不稳定,她不可能再回到学校念完大学,而这就损害了她的就业前途,令她只能一直处在供大于求的底薪劳工行列当中。因为工作时间又长又不规律,劳工也很难被组织起来,为争取较好的工作条件而抗争。相反,他们会变得格外焦虑,而且睡眠不足,后者更令人容易出现剧烈的情绪波动,而美国约有13%的高速公路交通事故是由于睡眠不足引起的。更糟...
2021-05-10 14:46:17
人力调度软件也制造出了一种恶性循环。想想前文中提到的单亲妈妈纳薇欧。因为工作时间非常不稳定,她不可能再回到学校念完大学,而这就损害了她的就业前途,令她只能一直处在供大于求的底薪劳工行列当中。因为工作时间又长又不规律,劳工也很难被组织起来,为争取较好的工作条件而抗争。相反,他们会变得格外焦虑,而且睡眠不足,后者更令人容易出现剧烈的情绪波动,而美国约有13%的高速公路交通事故是由于睡眠不足引起的。更糟糕的是,因为这种软件是设计来为企业省钱的,其往往会将员工的每周工作时间限制在30小时之内,这样,公司就不必为员工提供医疗保险。而因为工作时间非常不稳定,这些劳工多数无法挪出时间做第二份工作。这一切看起来就好像设计这种软件就是为了惩罚底薪劳工,令他们无法出头一般。 引自 第七章 反馈 剥削人力资本与社会总成本的增加(医疗健康),企业税收减少与政府收入减少,挤压福利支出。
207-208页
公司的雇主们已经过分沉溺于我们的各种数据。正如我们所见,他们频繁地使用这些数据,去衡量我们是否是有潜力的雇员和工人。他们试图借助数据勾勒出我们的思想和我们的朋友圈,并预测我们的生产力。 引自 第九章 “一般人”公式 回应 2021-05-10 14:46:17 -
元非 (Fuck-up Artist)
教做题还得看华人 出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学...2020-06-13 16:05:58 6人喜欢
教做题还得看华人
出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂,为了“优化招生”,教育咨询产业兴起了。 教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(Forecast Plus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(Right Student)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选,包括可以支付全额学费的学生,以及可能有资格获得校外奖学金的学生。就这个意义而言,学习障碍对于大学录取可能反而是个优势。 …… 教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼,是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生,计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示,假设一个美国高中生的平均学分绩点(GPA)为3.8,SAT成绩为2000分,课外活动时间为800小时,那么他被纽约大学录取的概率为20.4%,被南加州大学录取的概率为28.1%。然后,星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并最终成功被纽约大学录取,则该学生就需向咨询公司支付25931美元,如果他最终成功被南加州大学录取,则需要支付18826美元。如果他的申请被两个学校都拒绝了,那么咨询公司将不收取任何费用。 每所大学的招生模型都全部或者至少一部分来源于《美国新闻》的大学排名模型,这些模型中的每一个都是一个小型的数学杀伤性武器。正是这些招生模型让学生和家长身陷焦虑,花掉大把的钱。而且这些招生模型都是不透明的,大多数的申请学生(或者叫受害学生)都被蒙在鼓里。这就为像马振翼这样的专业咨询人士创造了巨大的商机,通过培养其在各个大学的人脉以获取第一手信息或者逆向推导各个学校的招生模型算法,他们破解了绝大部分学校的招生模型。 引自 排名模型的焦虑和杀伤性的对立面 回应 2020-06-13 16:05:58
这本书的其他版本 · · · · · · ( 全部5 )
-
Crown (2016)7.6分 166人读过
-
-
Broadway Books (2017)暂无评分 8人读过
-
Penguin (2017)暂无评分 1人读过
以下书单推荐 · · · · · · ( 全部 )
- 经管:定位/产品/组织/运营等2 (alenwg_cn)
- 黄书 (丝绒陨)
- 左其盛好书榜 (左其盛)
- 数据科学与人工智能 (lyb)
- 怎能读尽天下书 (疏狂老鬼)
谁读这本书?
二手市场
订阅关于算法霸权的评论:
feed: rss 2.0
19 有用 Nemo 2018-11-03 19:57:21
这是一本很牵强,有偏见的书. 作者作为数据科学家给我的感觉就是害怕数据.数据本身是没有好坏的,到了人的手里有不同的用法. 书中举的由于模型偏见带来的问题,我感觉作者是在讨好中下阶层的人.或许这些人才是这本书的受众,可以把自己的不行归结到社会上. 整本书也没有给我更多的启发, 我也没有看到作者会为此做出切合实际的行动或者建议. 书名能吓人, 给偏见找一个帮凶(这本书是数据),提出一个可以泛泛而谈的问... 这是一本很牵强,有偏见的书. 作者作为数据科学家给我的感觉就是害怕数据.数据本身是没有好坏的,到了人的手里有不同的用法. 书中举的由于模型偏见带来的问题,我感觉作者是在讨好中下阶层的人.或许这些人才是这本书的受众,可以把自己的不行归结到社会上. 整本书也没有给我更多的启发, 我也没有看到作者会为此做出切合实际的行动或者建议. 书名能吓人, 给偏见找一个帮凶(这本书是数据),提出一个可以泛泛而谈的问题,却没有实际建议. 这本书十分糟糕 说实话,模型不是万能的,需要透明化不断调整。这个观点我赞同,但让算法跟公平牵扯在一起讨论就很牵强了。算法是真实的,但公平是不存在的, (展开)
0 有用 二源 2021-12-04 20:55:18
带着好奇心查了作者举的一些例子,发现不少都是作者臆想的
0 有用 抽抽经会被虐 2018-11-13 00:12:16
How damage the WMD serves the world... #English
0 有用 吕畅九 2020-11-23 08:12:28
@2020-11-23 08:12:28 @2020-12-20 15:16:24
0 有用 淡定哥走路带风 2022-02-19 03:24:42
数据大杀器就把你我当成待宰的羔羊,而这种情况我们恰恰无能为力。
0 有用 小璐璐 2022-06-12 23:36:10
里面的小故事小片段,还是蛮有趣的,翻译得也很不错,是我写论文的有益素材。
0 有用 蓬山远 2022-06-10 00:25:57
资产定价(无视风险),综合评价(军备竞赛),计算广告(隐私侵犯),数据辅助执法(损害公平),招聘中的人格测试(歧视),运筹优化(压迫劳工),信用审核(歧视),保费厘定(歧视),选举政治(公平)
0 有用 锤 2022-05-29 23:04:19
有时候我觉得一些书为什么不直接缩成一个推送,我还能看得爽一点,你说呢?
0 有用 Eleven. 2022-05-13 17:01:05
一本儿通识~
0 有用 若隐若现 2022-05-11 21:39:42
作者前面大篇幅的论述是将“罪名”安到数学模型上,后面提出的解决方法主要是审查,而审查方法主要也是数学。作者通过观察发现了重要问题,但对问题的分析和理解没到点。