《统计数据的真相》试读:第2章 错觉的误导

    70%的交通事故是由没有饮酒的驾驶者造成的,一个酒鬼对这个信息的反应就是:“那么,我还想要一杯啤酒。“     某个零售商购入100马克的货物,当他卖出后,得到200马克。那么,这个商人的收益率是多少呢?     “无耻至极!”作为顾客的我们是这样来回答的。“整整100%的利润啊!”     “现在的情形也不是那么糟糕,”这个商人说。“50%的收益确实不算多。”     显然在这里双方的看法都是对的。100马克是100马克的100%,是200马克的50%。尽管如此,但不同人的表达会由于出发点不同而相距甚远。     对于一件相同的事情来说,人们仅仅是采取不同的比较方式与角度,就表现出如此大的差异性。现在我们去观察下面图形中的颜色。在黑色背景条件下,灰色就显得更白一些;相反,在白色背景条件下,灰色就显得更黑一些。     统计学也是一样,在经过《真理报》、《图片报》和《新德国》(Neues Deutschland)的交替报道后,还有谁会不知道令人难以置信的结果!关于两个球队的比赛结果:《真理报》的说法是,“勇夺第二的年轻人!”“美国人倒数第二。”我们知道,用现金支付货款会有一定的折扣,这样就会吸引一部分原本使用支票的顾客使用现金支付货款,从而减少了使用支票的费用。在德国,谁家有孩子,谁就会获得一定的免税额,这种做法会使相关的纳税人非常高兴;相反,对于没有孩子的工人来说,政府就要对其征收一个特别税,这样自然就会激怒纳税人。一个能使90%的病人活下来的手术,会让我们乐观地展望未来;而一个会使10%的病人死亡的手术,则会使我们异常悲观。     同样一个玻璃瓶子,既可以说是半满的,也可以说是半空的。同样一个数字,既大也小。之所以会出现这种现象,完全取决于人们怎样去比较。如果联邦德国在一年内又新增债务0.049万亿马克,也许我们会说:“这不是什么大数目!”相反,如果我们听到联邦德国新增债务490亿马克时,我们会关心地询问,这种情况什么时候可以改善。而如果是4 900 000万马克的负债,那么对于我们来说,这就是一个十分可怕的数字。     实际上,债务在不同的表述方式下是一样多的。4 900 000万马克就是490亿马克,或者就是0.049万亿马克,但是听起来感觉却各不相同。其基本计量单位一会儿是万亿,一会儿是亿,一会儿又是万。因此,不同的计量单位会使同一件事情表现出不同的面貌。     每个数字都可以经过人为的方式变大,只要在它们的后面加上许多零就可以了。借助于一个完全小的计量单位,我们可以制造出一个具有很多零的结果,这个结果就像基督圣体节中巡游的队伍一样长。一种物质的放射性活度,即原子核每秒振荡的数量,可以用两种方式来表示:居里(Curie),表示符号为Ci;贝可(Becquerel),表示符号为Bq。1贝可意味着1次衰变/秒,而1居里是370亿次衰变/秒。所以,千分之一的居里与3700的贝可一样。因此,如果用居里单位来衡量几百或几千荷载的贝可,几乎是不可能测量的。由此我们就可以猜测许多次,究竟绿党喜欢哪些标准,而核电企业的利益集团又喜欢哪些标准。     2.1 低谷与高峰     如果一个讨论的出发点(例如用于比较的基期数据等)不是由外界预先设定的话,那么,一般来说总会显示出谨慎的态度。当我们对比昨天和今天时,就特别符合这种情形。根据不同的情况,我们所说的“昨天”具有不同的意义,如果说它们具有相同的含义,则多少有些讨喜的意味。例如对于失业者或者通货膨胀而言,过去的价值越高,“现在的价值”看起来就更好一些,因此,执政党更愿意测量历史最高发展水平。相反,对于经济增长或者贸易顺差而言,过去的价值越低,现在的价值就越高,因此执政党更愿意采用相对萧条的状态作为自己绩效的基数。(反对党则正好相反,他们喜欢比较好的经济数据和更好的经济数据。)     要证明经济上升趋势的曲线一般是始于谷底的,在一个具有积极意义、持客观态度的报道中,人们大概能够找到类似左边的那幅图。     对视觉来说重要的是:曲线始于什么地方?     如果我们采取相反的做法,像右图那样,曲线就会始于谷底,那么所有的情形看起来就会好很多。比如德国的纺织工业。德国《经济周刊》(Wirtschaftswoche)成功地进行了相关研究,以每10个月为一个周期,描述了德国纺织工业向坏的和向好的景象。左图表达的意思是,“纺织品在联邦德国私人消费那里,早在几年前就已经下降了。这种情形即便在1989年也几乎没有什么改变。在预测私人消费会实现实际增长2.5%的条件下,纺织品消费与前一年相比增长不会超过1.5%。”这种比较悲观的预测在图形当中得到了反映:曲线起始于高峰,终止于谷底。     完全相同的曲线,从不同的谷底位置起始,会出现不同的结果,或是乐观或是悲观。     这个图表形成后,没过几个月就出现了完全相反的情形:曲线先是起始于谷底,然后持续地上升;图表旁边的文字说明是:“联邦德国的纺织工业在1990年也呈现出强劲地上升趋势。纺织工业在这一年的销售增长预计能够达到5%~6%。”     2.2 婚姻生活的统计学风险     人们无论是由于疏忽还是有意欺骗,相比较而言,婚姻生活的基本事实所体现出来的意义更好地说明了一点,即许多统计数据所表现出来的事实完全是一种误解。几年前,一家美国报纸用哲理推论了发生在美国的暴力犯罪。绝大多数暴力犯罪发生在家中,即厨房、起居室和卧室。这家报纸的结论是:晚上,人们只有睡在中央公园才是比较安全的。     伦敦《时报》(Times)文章“50%的女性被害者是被自己的男朋友或丈夫杀死的”对婚姻生活的危险性进行了推论。只有约10%的被害妇女是由完全不认识的人谋杀的,一般来说,犯罪嫌疑人来自受害人的家庭生活圈(特别是在周末或度假中,“这时家庭成员是在一起的”)。     显然这是一个谬论,其产生的根源就在于基本的事实判断错误。受害人一般是被人谋杀的,而且是被她认识的人所害,这不是针对男朋友、丈夫和熟人所提出的证据,只是一个后果,即通常相识或亲近的人比完全陌生的人更具有谋杀的动机和机会。如果男人被害,也通常是被自己认识的人所害;当家庭成员在一起时,也会发生这种谋杀,原因很简单,素不相识的两个人通过心灵感应谋杀的可能性非常罕见。     在纽约的卧室和厨房中同样会比在中央公园中发生更多的谋杀,这绝不是因为住宅一类的设施是危险所在,而是与其他地方相比,我们在住宅中经常是直接面对面。相反,如果人们晚上在家中睡觉,那么在中央公园被刺伤、枪击或被掐死的可能性则要远远大得多。     我们已经讨论了谋杀、殴打和死亡等一些令人不愉快的话题。与老年人相比,青少年被误认为是具有较多自杀倾向的一类人群,这一基本判断就是建立在错误的比较基础上的。一家德国报纸文章“老年时会变得更幸福”分析论证了下面的结果:在20岁以下的青少年中,自杀在所有死亡中所占的比例最大,共计25%。而30~40岁的人自杀率占到10%,超过70岁的老年人自杀率不足2%。“年龄越大,决定自杀的比率就越低,”这家报纸如此写道,因此我们会随着年龄的不断增长而变得越来越幸福。     事实正好相反。随着年龄的不断增长,自杀率在上升,20岁以下的青少年自杀率不足1/105,70岁以上老年人的自杀率则几乎达到50/105。我们的年龄越大,就越容易做出决定,自愿结束自己的生命,这种现象存在于各个国家的各个时期。然而,自杀在青少年那里的确起着一个非常显着的作用,其原因主要是青少年一般来说很少自然死亡。他们很少患癌症和循环系统疾病,中风或肝脏损伤在青少年中也很少发生。换句话说,在青少年年龄段,事故、谋杀和自杀几乎是主要的死亡原因,而自杀在各类死亡中所占的比例又比较高。明白了这个道理,对于青少年的高自杀率,人们自然也就不会大惊小怪了。     我在某本旅游杂志中读过一篇文章:汽车驾驶人在快到目的地时通常会降低注意力,所以在假期旅游中,必须特别注意最后几公里路程。得到这个结论的基础就是统计学,绝大多数事故都发生在距离肇事者住所方圆30公里范围内。汽车驾驶人频繁地在其住所附近发生不幸,原因在于他过于熟悉这个地方,显然文章作者并没有注意到这个问题。     “促进休闲科学协会”通过研究得出一个结论:“休闲时光是刑事犯罪最好的温床”。喝酒不给钱、商店盗窃、无照驾驶以及谋杀等,这些行为经常在犯罪嫌疑人空闲时发生(同样的错误也发生在《时代》杂志:不是时间,又会是什么呢?)。德国全国汽车俱乐部一再认为,车速快不是事故的主要原因,因为绝大多数交通事故是在限速的条件下发生的。也有些人认为,白天驾驶汽车比晚上更危险(因为70%的交通事故发生在白天)。     上面所列举出来的错误总是一样的。我们也可以用这种逻辑得出结论,医院里存在生命危险(因为一半的联邦德国公民死于医院),国家公立学校制造了刑事罪犯(因为所有监狱中的囚犯都曾经在这些国家公立学校学习过),或者人们通过阅读报纸知道了掉头发的知识。(有多少拥有这种不幸的人事先没有读过报纸?)     在时速达到200公里的情况下,发生交通事故的概率肯定低于时速50公里,因为几乎没有人能够开得这么快。据我所知,在时速400公里的情形下,迄今为止在联邦德国高速公路上还没有发生过一起交通事故。基于相同的原因,白天发生的交通事故肯定高于夜间,尽管夜间开车比白天开车更加危险(因为晚上车少,所以发生事故的机会就少)。     如果你在《明星》杂志(Stern)上读到:“足球运动员是最纯粹的损伤先锋。他们造成的体育事故占每年约100万起体育事故的一半”,这几乎不符合事实。因为足球运动员的总数更多,所以与其他项目的运动员相比就会出现更多的事故。事实上,最大的损伤先锋应该是阿尔卑斯山上的滑雪运动员,其中8%的事故造成了很大的伤害,这一数据远远超过了足球运动员的比例。     滑雪事故中也同时伴有混乱状态。“超过50%的、在卡通斯皮托(Kantonsspital)得到治疗的不幸者,均来自联邦德国”,《明镜》周刊如此报道。这份杂志是说,德国人比其他国家的人在瑞士的滑雪道上更加狂野。这种说法可能是对的,也可能是错的。如果没有滑雪者中德国人所占的比例数据,那么这种统计就无法表述。如果80%的休假游客来自联邦德国,那么,受伤者中的50%就是一个具有质的标志性数据。     同样,纽约《时代》杂志对酒精中毒的原因所持的理论也未经过证明。它的一个根据是,男人酗酒和已婚妇女酗酒没有什么不同。因为2/3的酒鬼都结过婚,这样人们就会联想,肯定是妻子带来的压力造成了丈夫酗酒。     实际上,已婚男子在酒鬼中所占的比例并不是最少的,但是我们还必须了解酗酒风险群体(风险群体是指符合结婚年龄的男子)中已婚男子的比例,事实上风险群体的整个比例超过了2/3,因此我猜测,上述统计甚至会起到一个完全相反的作用,即它预示着一种理智的婚姻生活。

>统计数据的真相

统计数据的真相
作者: 瓦尔特.克莱默
isbn: 7111255119
书名: 统计数据的真相
页数: 185
译者: 隋学礼
定价: 32.00元
出版社: 机械工业出版社
出版年: 2008-12