书中的一些例子都是驳斥朋友圈无脑必转和反智风潮的所谓专家帖子的有力武器

Item: 赤裸裸的统计学
Rating: 4
Author: 素月墨羽

2016-02-12 15:50:50

这篇书评可能有关键情节透露

不错的统计学通俗读物，书中的一些例子都是驳斥朋友圈无脑必转和反智风潮的所谓专家帖子的有力武器。按章节摘录一些案例，以备朋友圈扫盲之用。

【统计学是大数据时代最炙手可热的学问】
谷歌首席经济学家范里安在接受《纽约时报》采访时曾说，在未来10年内统计学家将会成为“性感的职业”。
loc. 191-192

盖洛普民意调查和研究机构认为，一个符合统计学方法、包含1000个家庭的样本能够代表整个美国的所有家庭，两者的调查结果基本能够保持一致。
loc. 236-238

统计学基本上也是干这些事情，凌乱无章的数据就像是犯罪现场，统计分析员就是警探，通过对原始数据进行分析和加工得到有意义的结论。
loc. 297-299

【描述统计学】
<<<平均数
平均数必须对“异常值”有足够的敏感性。
loc. 440-440

<<<中位数
一些数量不多的打印机存在大量的质量问题。这些异常值抬高了质量问题的平均数，但没有对其中位数造成影响。从生产的角度看，更为重要的一点是，公司无须更新或重组整个生产流程或

生产设备，唯一需要做的就是调查这批问题很多的劣质打印机，找出源头并予以解决。
loc. 464-467

收入分配数据还可以分为“十分位数”，每组包含10%的数据。如果你的收入属于美国人均收入分配顶层的那10%，那么这意味着你要比90%的美国人挣得都多。
loc. 471-472

要评价美国“中间阶级”的经济状况，我们需要了解（通货膨胀调整后的）工资中位数在过去几十年中的变化，他们还建议我留意一下处于第25百分位数和第75百分位数人群的工资变化，因

为这两拨人通常被认为是中产阶级中的高收入和低收入人群。
loc. 634-637

<<<正态分布
根据《华尔街日报》的报道，美国人甚至连在购物商场停车都呈现出正态分布，正对着商场入口的地方停车数量最多，也就是正态曲线的“峰值”，在入口左右两侧的停车数量逐渐变少，即

曲线两端下滑的“尾巴”
loc. 541-542

【统计数字会撒谎】
如何评价一个行业是否健康，这一点量化起来似乎并不难，就看我们如何选择了，是选择以产出量还是就业率为衡量标准？
loc. 737-738

世界各地人民的收入不均衡因为全球化的到来是改善了，还是恶化了？
一种理解是，全球化只是加剧了现有的收入不均状况，1980年时的富裕国家（以人均国内生产总值为参考）在之后的20年间的增长速度超过了贫困国家。富国会变得更富，这说明贸易、外包、外国投资以及其他全球化的组成部分沦为了发达国家扩大经济霸权的工具。
如果换一种分析单位，同样的数据也可以（也应该）以一种完全不同的方式来解读。我们不关心穷国，我们只关心穷人。恰巧世界上有绝对比例的穷人生活在中国和印度，这两个国家都是人口大国（人口数量均超过10亿），而且在1980年的时候这两个国家都处于相对贫穷的发展阶段。但是，在过去的几十年时间里，中国和印度的经济都经历了高速发展，这在很大程度上要归功于它们与世界上其他国家日益加深的经济一体化。《经济学人》这样评价中国和印度：“它们都是‘迅速的全球化者’。”考虑到我们的目的是改善人类本身的穷困，因而在衡量全球化给全世界穷人带来的影响时，将中国（13亿人口）和毛里求斯（130万人口）当成是比重相同的两个国家来看待是不合理的。
loc. 757-767

统计学的一个重要角色就是描述数量随着时间推移所发生的变化。
loc. 881-881

心脏科医生肯定会在意他们的“记分卡”。但是对于一个外科医生来说，降低病人死亡率最简单的方法并不是降低病患死亡人数，因为大部分医生在救死扶伤方面已经竭尽全力了。降低死亡

率最简单易行的方法是拒绝为那些病况最严重的病人动手术。罗彻斯特大学医学与牙医学院的一项调查表明，以服务病人为初衷的记分卡，到头来反而会给病人造成伤害：在参与调查的心脏

科医生中，有83%的医生表示正是由于公开了死亡率数据，一些本来可以从搭桥手术中获益的病人最终没能被安排进行手术；79%的医生表示收集并公开死亡率数据或多或少地影响了他们的治

疗决策。这一看似有用的描述性数据存在一个可悲的矛盾，而心脏科医生也只能理性地接受并采取自己的对策，就是让那些最需要心脏搭桥的病人远离手术台。
loc. 979-986

【概率与期望值】
头戴科技耀眼光环的DNA分析，归根结底仍然是一个概率问题。
loc. 1279-1280

通过概率的计算，我们还可以得到在所有管理决策的过程中，尤其是在金融领域是最实用的统计工具：期望值。
loc. 1305-1306

有时候，针对全美国人口监测如艾滋病这类罕见但严重的疾病是行不通的。假设我们对某种罕见病的检测拥有相当高的准确度，举例来说，每10万人中会有一个人患上某种疾病，检测准确率

为99.9999%，可以保证在检测过程中不产生一例伪阴性（也就是从不漏过任何一个患上该病的人），但产生伪阳性（也就是一个没有患上该病的健康人被误测为阳性）的概率为万分之一。这

样就会导致一个棘手的状况，虽然这种疾病的检测准确率非常之高，但绝大部分被诊断为阳性（也就是患有该疾病）的人实际上根本没有得此病。这会在那些诊断结果为阳性的人群中产生巨

大恐慌，后续的检测和治疗也会浪费有限的医疗资源。如果我们对美国所有成年人，即约1.75亿人口进行检测，决策树形图如图5-5所示。图5-5 某疾病全美国筛查情况只有1750位成年人

患有该疾病，他们的检测结果均为阳性。有超过1.74亿成年人未患病，在这部分健康人群中，有99.999%的人得到了正确的检测结果，只有0.01%的人被误检为阳性。但1.74亿的0.01%依然是一

个非常大的数字，因此在实际操作中平均将会有1.75万健康的人被告知患有该疾病。
这意味着什么？我们一起来分析一下。总共有19250人的检测结果为阳性，但真正患病的只有9%，而且这

还是一个准确性非常高、伪阳性非常低的检测。我想不需要作太多解释，大家就能理解为什么在削减医疗开支的过程中，我们该做的不是对健康人群加强疾病筛查，而是减少这类检测。以艾

滋病为例，公共健康官员总是建议将有限的资源用在“刀刃”上，即用在男同性恋者、采取静脉注射的吸毒分子等高危人群身上。
loc. 1406-1420

经营汽车产品及其他零售商品的加拿大轮胎公司有一位“爱好数学的首席执行官”J·P·马丁，他专门研究在面对商品时，哪些人更愿意掏钱消费，而哪些人倾向于转身离开。这是一个非常

有趣的课题，马丁对上一年使用加拿大轮胎联名信用卡消费的每一笔交易数据进行了数据分析，发现在综合考虑收入、信用纪录等传统统计指标的基础上，观察消费者购买了什么商品能够准

确地预测出他们接下来的消费行为。
loc. 1457-1460

【黑天鹅事件】
最大的风险从来就不是那些你能看得见、算得出的，而是那些你看不见从而无从估量的，那些看上去似乎远不在正常概率范围内、远远超出你的想象、你认为一辈子都不可能发生的风险，事

实上，它们的确会发生，而且比你所能想到的要频繁得多。
loc. 1599-1601

人们对于随机性的直观感受与概率的相关定律之间存在着鸿沟。
loc. 1678-1678

伊利诺伊州彩票的广告词却深得我心：“总有人会中头彩，那个人有可能就是你。” 为了证明这一相同的论点，我还和我的学生进行过一个实验。班级的人数越多，效果越好。我让班上所有

人都拿出一枚硬币，并从座位上站起来，我们一起抛硬币，硬币正面朝上的学生必须坐下。假设我们一开始有100位学生，在第一次抛硬币结束之后，有大约50人坐下；然后我们开始第二次抛

硬币，之后还剩下约25位学生站着；然后是第三次、第四次……通常最后总是会剩下一位学生在连续5次或6次得到硬币反面朝上的结果后，依然站在那里，我会在这个时候走到这位同学的身

边问他“你是怎么做到的？”、“你平时都做些什么特殊训练，可以连续这么多次都做到反面朝上？”、“你是不是吃了什么特别的东西？”等，这些问题惹得全班同学哈哈大笑，因为他们

目睹了整个过程，他们知道这位抛硬币得到6次都是反面结果的同学并没有什么特殊的技能，一切只是巧合。但如果脱离了这样一个环境，当我们目睹一些异常的事件发生时，我们总是会想：

“没那么巧吧？背后肯定有什么原因。”但事情偏偏就是这么巧。
loc. 1688-1697

概率学告诉我们，跟在异常值—在某个方向上远离平均数的数据—之后的更有可能是那些接近（长期积累得出的）平均数的数据。
loc. 1716-1717

【数据与偏见】
一般来说，我们会要求数据做3件事。第一，在评价某一大数据构成的人口特点时，我们可能会用到一个具有代表性的数据样本。比如，调查某个领导候选人的民意支持率，我们就需要对一组

潜在的选民进行采访，而且他们应该能够代表所在选区的所有选民（必须明确的是，我们并不需要一个代表所有生活在该区域内的居民的样本，而是代表那些最有可能去投票的选民的样本）

。统计学最强大的一点就在于，由一个在合理范围内足够大，并且正确抽取的样本推导出来的结论，能够准确地反映整个人口的特点，做到与对全体人口进行普查得到的结果分毫不差。
loc. 1805-1810

《纽约时报》曾发表了一篇关于抗抑郁药物药效发表性偏见的文章，第一句话就是：“抗抑郁药百忧解、帕罗西汀等产品的生产商故意不发表更多的药物试验结果，就是为了获得政府许可，

误导医生和消费者对药物真实效果的看法。”那些证明这些药物对治疗抑郁症有效的研究中有94%都得到了发表，而发现这些药物无效的研究中只有14%被发表在相关刊物上。对于抑郁症患者

来说，这样的发表性偏见确实会造成误导。如果将所有研究成果进行综合考虑，其实抗抑郁药造成误导的效果只比安慰剂（外观与抗抑郁药相同，给对照组服用，不含任何药物成分）略好。
loc. 1963-1968

下面就来说说，它们是如何在没有跑赢市场的情况下“跑赢市场”的。某家大型共同基金公司会同时开放许多只共同基金（有专家专门负责挑选股票，通常会有一个特定的关注点或策略），

举个例子，假设一家共同基金公司开放了20只新基金，其中每只基金跑赢标准普尔500指数的概率都约为50%（这一假设与长期数据是吻合的）。现在，基础概率学告诉我们，该公司第一年只

有10只新基金的表现能够打败标准普尔500指数，连续两年打败标准普尔500指数的基金为5只，连续3年打败标准普尔500指数的基金只剩下了2～3只。最精彩的内容马上就要来了。届时，那

些相比标准普尔500指数收益率不够理想的共同基金基本上都已经被悄无声息地关闭了（它们的剩余资产都被并入其他现有的基金中）。该公司接下来就可以大肆打广告，宣传这两三只“表现

始终优于标准普尔500指数”的基金了，而实际上，它们在这3年的良好表现就相当于连续抛3次硬币都得到正面朝上的结果一样。它们接下来的表现很有可能会回归平均值，但此时投资者的钱

已经被成功地骗进来了。真正能够在相当长一段时间里，对标准普尔500指数保持不败战绩的共同基金或投资专家少得可怜。
loc. 2013-2023

【中心极限理论】
如果抽取的每一个样本与其所代表的群体确实存在相似关系，那么这个群体将总是与其样本保持一致性。（如果孩子与其父母长得很像，那么父母肯定也与孩子长得很像。）
loc. 2093-2094

有一个经验是，样本数量必须达到30，中心极限定理才能保证成立
loc. 2167-2168

【统计推断与假设检验】
降低癌症发病率的生活习惯，如少吃红色肉类、定期锻炼、常做身体检查等（这就是前面章节里介绍的“健康用户偏见”）。到底是麸皮饼的功劳，还是因为这群爱吃麸皮饼的人恰好具备的

其他行为或个人素质？分清楚“相关关系”和“因果关系”将有助于我们更好地理解统计结论。
loc. 2422-2425

我们在医学上有多种方法用于初期癌症的筛查，如乳腺图像（乳腺癌）、前列腺特异抗原测试（前列腺癌），甚至全身核磁共振扫描（看看身体哪个部位存在问题）。对于任何一位进行癌症

筛查的人来说，零假设都是没有患上癌症。筛查的作用就是通过发现可疑结果，进而推翻零假设。按常理，Ⅰ型错误（身体没有任何问题的“假阳性”）总是要优于Ⅱ型错误（癌症没有被诊

断出来的“假阴性”）。从历史上看，癌症筛查经常站在垃圾邮件过滤的对立面：医生和病人总是愿意容忍一定程度的Ⅰ型错误，而尽力避免出现Ⅱ型错误。最近，美国卫生政策专家开始挑

战这一观点，这是因为Ⅰ型错误所导致的高费用和副作用。
loc. 2550-2555

【回归分析与线性关系】
其实最危险的一类工作压力来自于对自己的工作任务“缺乏控制力”。
loc.2855

【致命的回归错误】
解释GDP 增长时，在回归方程中加入失业率因素是不合适的，因为失业率很显然会受GDP 增长率的影响。或者换一个角度来看，通过回归分析，发现失业率的下降会促进GDP 的增长，这样的

结论是可笑的、没有任何意义的，因为为了降低失业率，通常的做法是促进GDP 的增长。
loc.3287-3289

无论什么研究，在量化高尔夫球对健康的影响时都必须正确控制“年龄”变量，通常来说，年龄越大，打高尔夫球的时间和机会越多，尤其是在退休之后。在打高尔夫球这个课题上，任何没

有将年龄作为解释变量的研究都不可避免地遗漏了一个事实，那就是打高尔夫球的人总体上比不打高尔夫球的人年长。因此，杀人的不是高尔夫球，而是衰老。
loc.3294-3297