《统计数据的真相》试读:前言

每天早上我们都会翻阅报纸,在读到报纸最后一页时,我们已经看到了比歌德和席勒生前看到的信息多得多的统计数据。失业者按照其来源不同进行统计,数据或多或少;癌症风险和臭氧黑洞不断增加;1/3的人生活在最低生活水平线以下;一个联邦德国公民一年内吃掉了5.8升食用冰;音乐家可以比其他人更长寿;农村的空气有益于健康,或者农村的空气不利于健康;全球到2020年将会有100亿人口;道琼斯指数又涨了30点;网球运动员B在与一个左手握拍、带着眼镜的选手比赛时从未输过,该选手比B年轻;与男性相比,超过25%的女性经常错误地拐入单行道;恐龙灭绝于6000万年前;吃猪肉会导致心脏病;外国人更容易成为罪犯;绿党的选民经常阳萎(这绝对不是开玩笑—这是一个汉堡的性学研究者在德国联邦议会上所做的说明);人们在纽约睡觉时,最安全的地方是中央公园;还有30年我们就要与下一次的核灾害分别了,目前存在着气候灾害的威胁;如果在下一个星期天投票,某党X不会进入联邦议会。     许多统计数据都是错误的。其中一些统计数据是在人们有意识地操纵下形成的,而另一些统计数据仅仅是源于抽样时没有运用适当的方法所致。在一些统计数据中,数字本身已经是错误的;而在另一些统计数据中,人们是在用正确的数字做错误的引导,把“苹果”和“梨”重新混到一起,提出带有暗示性的问题,继续以不在意的方式推导趋势,笨拙地计算比率、份额或者平均值,任意篡改概率或者扭曲抽样检验的真实含义,上述种种做法对于许多人来说会产生一个印象:谎言和统计学就像一对不能拆分的连体婴。自从本杰明?迪斯累里(Benjamin Disraelis)谈及“世界上有三种谎言:谎言、该死的谎言,还有统计数据”之后,相关的俏皮话、讽刺语就不断地落到可怜的统计学家头上。     这种批评、讽刺虽然“微不足道”,但在某种意义上却是真实的。之所以说“微不足道”,是因为人们不仅可以使用而且能够滥用每一种统计工具。统计数据在这里肯定不是孤立无援的,而是具有许多相互关联的因素。之所以说“真实”,是因为我们所有人看到的世界都是以我们喜欢的方式看到的世界,而不是世界的客观本来面目。我们使用统计数据的目的仅仅是像“一个喝醉的酒鬼使用电线杆:首先是为了寻找能够支撑我们立场的基石,很少是为了进一步说明客观事实”(安德鲁?朗)。     作为一个统计学家,本书总结了我24年以来职业生涯的相关经验。在此我绝不是凭借着专业数据收集家的身份自以为是,从而觉得高人一等,事实是,在各种情况下,我都避免出现这种情况。提供真实的实际数据不是可能不可能的事情,而是愿意不愿意的事情,这是许多数据吹嘘者明显的相通之处。     媒体有一个君子协定(Gentlemen誷 Agreement),在做一件好事时,真实并不那么重要(即手段要为目的服务)。如此一来,《德国医生》杂志(Deutsche €rzteblatt)凭借着很容易就能申请到的研究经费对艾滋病统计数据中的一项错误进行辩护,这个错误就是:通过所谓的“积累”,当前的病人数量要多于实际存在的数量。“如果积累有益于这个效果的话,”我们读到的可是白纸黑字写得清清楚楚的东西,“那么,我们就应该让这种情形再保持一段时间。”     为了服务于主观或者客观方面好的目的,各个理论派别对“许可说谎”(License to Lie)这种说法都持相同的赞成意见;从左派党团到右派党团,正如从激进人士到保守人士,所有人都是这么做的。如果在某种情况下数据可靠性增加,那么那些数据美化者会根据这种可靠性误以为自己掌握着绝对真实的数据。谁能够确知世界将在20年后毁灭呢?若不是发生了上述这种情况或是发生了其他事情,如果这个人仅仅通过忠于事实和客观实际等常规性思考方式来进行补救工作,他就会明显感到补救工作具有难度。“如果人们看到的某件事情越波折起伏,形成的原因越复杂,那么人们对此就越有兴趣”,这就是一个美国气候研究者对其相当大胆的、根据逻辑推理所做的天气预报(当然是错的)道歉时所说的笑话。作为科学家,有时必须“要引起一些小的混乱,这样做的目的主要是为了让大家注意到自己”,来自德国的臭氧研究专家也持相同的意见。     不仅仅是人类的拯救者想让事情表现出不同于它们实际本来的样子,绿色和平组织的示威游行者也在分享着这种尝试,他们经常在全体人员参加的大会上扮演着一个不可能取得任何结果的集团首脑角色,或是追逐猎物的猎人。他们研究不忠诚的婚姻配偶的所做所为,其行为就像一个招揽更多人进行疗养的疗养院主任,也像赞成或者反对速度限制的全德汽车俱乐部(ADAC)的主席。自从有了数据,也就有了数据的人为操纵。     对于这些或多或少无耻的人为操纵行为,我在后面的内容中不会给出它们之间的差异,而是对这些统计学意义上所存在的数据伪造者采取一视同仁的态度。当然我也不会认为,一个使人产生错觉的洗涤剂广告应该像由人为操纵而产生癌症风险的行为一样,要受到人们的谴责。从一个较高的层次来看,它们之间肯定存在着差异。我想在这里主要是方法上的差异,而不是原因或者目的上的差异。     如果仅仅是为了弄清楚这些不同的方法之间的差异,那么人们不需要专门学习统计学。对此人们可以完全放心,谁还能依稀记得中学或者大学里那些相关课程的内容呢?对于识别日常生活中大大小小的数据骗子,这些知识已经足够了,人们根本不必来阅读和理解本书。最后,如果一个人为了倾听并辨别另一个人的歌唱得是否正确,他也没必要一定是意大利着名男高音卡鲁索(Enrico Caruso)才行。     人们已经发现许多人为操纵统计学行为的基础形式,并进行了详细的分析。对于我来说,灵感的一个永恒源泉就是达雷尔?赫夫(Darrel Huff)与他那本永不过时的经典着作《统计陷阱》“How to Lie with Statistics,New York,1954)”,其德语译本于1956年在瑞士苏黎世出版(德语名字:Wie l焔t man mit Statistik)。自从《统计陷阱》出版以来,许多统计学家与利用数据骗人的无耻之徒一样,从中学到了不少有用的知识,以至于出版了许多在书名方面相似的书籍,当然本书在内容方面与它们并不重合。托马斯?拉克斯、埃娃?玛莉亚?尼斯华巴(Thomas Lachs ,Eva Maria Nesvadba)于1986年在瑞士维也纳出版了一本统计学方面的书:《统计学—谎言或者真实》,这本德语书也具有相同的思想。其他的文献与相关资料来源我会在每章的章末尽可能详细地列出。     我要感谢的人很多,特别是我在多特蒙德大学和汉诺威大学中的那些卓越的学生代表。另外也包括我的同事格茨?特伦克勒和彼得?富劳默尔(Peter Pflaumer)。科隆德国经济研究所的克罗克尔博士(Dr. Kroker)非常友好地给我提供了有关星期六工作方面的资料。海德?阿斯豪夫(Heide Abhoff)和艾尔克?格布哈特(Elke Gebhardt)给予我在画图和手稿编辑方面的支持。在核实资料来源和引文方面,克里曼斯?蒂尔克(Clemens Tilke)和奥拉弗?科恩(Olaf Korn)与我一起开展了有意义的合作。拉尔夫?容德(Ralf Runde)审读了手稿,以保证我在各种文体方面不致出问题。Tilmann Deutler、Monika Eberstaller、Michael Eberstaller、Hermann G歱pl、Doris Kr妋er、Sonja Michels、Axel Scheffner、Johannes Schornstein、Claudia Sch焧ze、Michael Schmidt等提出了很多不同的想法与建议。最后还要感谢坎普斯出版社(Campus)的贝内迪克特?布卡德(Benedikt Burkard),他为最终的编辑工作付出了很多心血,并对手稿做了多处修改,使本书具有了更高的可读性。在此我感谢所有人。我还要特别说明的是,如果您在阅读本书时发现了遗留下来的错误,特别是争论激烈的价值判断和成见,那么,所有问题都文责自负。     瓦尔特·克莱默

>统计数据的真相

统计数据的真相
作者: 瓦尔特.克莱默
isbn: 7111255119
书名: 统计数据的真相
页数: 185
译者: 隋学礼
定价: 32.00元
出版年: 2008-12