《统计数据的真相》试读:第4章 自夸的百分数

    “一个百分数!真的!     真的,这些家伙拥有美丽的辞藻     —这一切是如此的镇定,如此的具有科学性……     而当人们一旦说到‘百分数’时,     也许就不再平静了……”     —陀思妥耶夫斯基,《罪与罚》     我们日复一日在报纸中成千上万次读到“百分数”这个词。我自己曾经查阅了两期《法兰克福汇报》。第一次总共出现了126次“百分数”(不包括广告和文艺专栏)。第二次是星期六的报纸,甚至达到135次之多!我自己猜测,这个词汇应该是当今德语中使用最频繁的一个词。     善意和恶意使用这个词汇的人对它的评价都是一样的,原因在于“百分数”具有数学的中立性和客观性。“百分数”经常会与商人的账户和复式记账结合在一起。商人记账时的严肃认真就像扣扣子一样,一个都不能错位。然而,对于可靠性与权威性来说,百分数是一个悬而未决的东西,因为百分数仅仅表现出某种确定性而已。实际上百分数说明了这样一个事实:人们赋予百分数以权威和优势,主要是为了更多地来加强这种可能性。但是,一些迷信百分数理论的现代接受者却根本不知道百分数的本质。     在英国公平贸易局(Office of Fair Trading)开展的一次调查问卷活动中,对于其中一个问题“40%是多少?”,被询问的银行顾客中大约有50%的人回答:大约是40或者1/4。或者谈到《诺德尼岛游泳报》(Norderneyer Badezeitung)的一篇文章:“如果在几年前1/10的司机驾驶速度较快,那么在今天已经变成1/5了。然而5%的超速驾驶,这个比例已经很高了,如果进一步控制违章的话,开车超速的司机还要支付更多的违章罚款。”     人们总是在用百分数的方式进行夸张。“104%的侦破比例”,这是德国耶拿警察给我们提供的信息(我从《世界报》中读到的)。“没有人能够比耶拿警察抓住更多的谋杀者:警察局在1993年查明了所有谋杀、谋杀未遂和各种杀人致死等案件的104.8%。”     答案就是:所有警察从不同的角度,登记了自己所参与侦破的案件,而这有可能重复登记,同一个案件被提到若干次。自然而然地,侦破“比例”就如上面所提到的那样,更有甚者,侦破比例还可能被任意地篡改:一年内所发生的一件谋杀案,3次被登记为侦破,这样我们就有了一个300%的侦破比例。     4.1 令人吃惊的妇女比例的增长     对于有意干扰公共秩序的行为来说,百分数自然不是一个单独的指标。正如我所知道的,如果5000人选举政党甲,那么,这一结果并不说明什么问题,但我依然和以前一样,对于这个结果还是一头雾水。在一个具有6000选民的社区选举中,5000人是一个非常多的数量,而在一个拥有100万选民的州议会选举中,5000人刚刚达到5‰的比例,如果把它放到联邦议会选举中,这5000人根本就像没有一样。所以在选举和可能性方面,我们首先感兴趣的是百分数的比例关系。“在购买彩票的过程中,1/3的购买者会中7等奖”,这是我在一本统计学教科书中读到的内容。在另一种博彩游戏中,每800人中会有270人获奖。问题是:哪一种博彩游戏的中奖机会更高一些?     然而,问题的另一方面也同样真实,这就是:一个百分数不但提供了一些信息,而且同时也掩盖了一些信息。如果我们在左边给出两个数字,也就是分子和分母,那么在等式的右边就可以得到一个唯一的结果。这就是所谓的信息。例如比例数字1/5、7/35或者117/585,所有这些相对数表示的都是一样的百分率20%,尽管分子(分母也一样)的差异性非常大。如果某人想要隐藏某个目的,那么他会更愿意以百分数的形式来表示。     “在我们的全部议员中,女性议员的比例已经提高了50%!”在联邦德国自由民主党(FDP)的党主席选举后,新闻媒体这样报道。联邦德国议会中的全体自由民主党成员异常兴奋,并为之鼓掌喝采。“嗯,是这样的”,其中一个议员轻声地说:“以前我们有4个女性议员,而现在增加到6个……”。     这里百分数的目的可能是强调一个嘲讽式的结果,即女性议员并非具有代表性,也就是说,在议会中女性议员的作用不大。也许正如一本众所周知的美国某大学某院系出版的资料宣传手册中所说的那样,根据统计资料得知,在校50%的德国女学生争着要嫁给一位大学教授。也许人们希望,在实际生活中、在某个时期内,去激励女性同胞更好地发展,原因是在大学教育中女大学生还普遍缺乏自信。但是女性接受教育无论如何是必需的。正如调查所显示的,全校只录取了两位女性,而其中之一是系主任的妻子。     令人印象深刻的百分数背后隐藏着的小数字,早已经是众所周知的一个传统了。在历史上的帝国议会里,就有过一次针对上巴伐利亚州的某个小村庄里所发生的非正常增长的质询事件。在那个小村庄里,官方的统计数据记录着其出生率达到非同小可的200%的增长比率,这“明显是一个无耻的、恶意的统计数据”,正如老专家恩斯特?瓦格曼(Ernst Wagemann)在其作品《统计学的滑稽表演》中所回忆的,“之所以出现这样一个统计数字,主要是暗含着这样一个原因,即一个妇女当她未婚时,就已经生下了三胞胎的孩子。”     艾伦?沃利斯(Allen Wallis)和哈利?罗伯茨(Harry Roberts)在《统计学的本质》一书中,详细记录了第二次世界大战中一位负责雷达业务的军官非常紧张的状态,这位军官长时间徒劳地一再向上级机关请求加强7名技术人员组成的雷达小组的力量,可是一直没有结果。但当其中一名成员的神经崩溃时,这位军官只是非常言简意赅地报告:“14%的人员由于过重的负担而变得精神恍惚,甚至出现神经错乱的现象”。由于这份报告,这位军官得到了比他原本能得到的多得多的人员,用来充实雷达小组的力量。     我们假设一个农场主,在他所饲养的全部家畜中,57%是牛,14%是猪,其余的畜类占29%。但是,有谁能够想到,这位骄傲的农场主实际上只养着4头牛、2只羊和1头猪?这就是他的全部家畜。开始时我们假设存在这样一种情形:大家熟知的“80%的测试人员”负责评判某种咖啡X、某种牙膏Y和某种割草机Z的质量,以及调查人们是否百分之百同意周日劳动是完全自愿的、无报酬的。其实,所有这些百分数都只有一个目的:隐藏最基本的数据,用百分数比例来表示这些基本数据。     特别要小心的还有这种情形:33.3%和66.6%。因为通过隐藏方式表现出来的基本数据(即舍弃了现象的表述只留下单一的数字)来说,如果存在着相反的情形,也许还有第三个方面的指标。     还有一些事情也是非常容易被百分数所掩盖的。如果我们问10个人:“你想选哪个政党做执政党?”,4个人决定选X党,用百分数来表示就是40%。但是没有一个人会用许多钱去打赌,这个抽样结果就是真正的选举结果,无论他是否听说过“抽样试验缺陷”……     相反,如果我们去询问1000个选民,其中有400人决定选X党,那么,我们就倾向于相信这个选举预测的结果(因为通过扩大抽样试验的规模,数据的可信度会大大提高)。     4.2 半数的人在独居     “近100年,人们的生活方式发生了剧烈的变动,”《南德意志报》(S焑ddeutsche Zeitung)写道。“20世纪初,大家庭成员之间彼此共同生活在一起是非常正常的现象。几乎有一半的居民……是生活在拥有5个人或者更多人的家庭中。而今天的德国与以前完全不同:2/3的居民独居或者是两个人一起生活。”证据是:66%的家庭人口小于3个人……     在美茵河畔的法兰克福,甚至有77.5%的家庭人口小于3个人,其中49.2%的家庭只有1个人。因此得出结论:半数的人在独居!     如果人们可以相信一位伦敦检察官的话,那么,这种大家庭的消失就应该受到欢迎,原因在于大家庭经常会发生刑事犯罪案件。只有很少的青少年犯罪案件(这些案件是由这位检察官主办的),令人讨厌、厌恶的犯罪嫌疑人是来自只有一个孩子的家庭。于是,对于这位检察官来说,结论就是:家庭规模越大,犯罪率越高。     这里,在涉及家庭人口数量计算时犯了一个相同的错误。虽然小家庭占家庭总数的比例较大,但是小家庭的人口在人口的总数中所占的比例非常小。     注:① 数据采集时间:1994年。② 由于基数较少,所以其表现出来的数值会受到一定影响。     资料来源:法兰克福统计局。     4.3 增长—风暴     百分数也经常在经济增长率方面进行欺骗。人们利用百分数很容易在和风细雨的现象中制造出一种狂风暴雨的幻象。现在假设一个公司的销售额如下:     100  101  102.5     从上面的数据可以得出结论:销售额先增长了1%,然后又增长了1.49%(1.5/101)。客观地说,这两个增长率数字非常小,也可以说,后一个增长率几乎贴在前一个数据之上,原则上我们不能用“具有活力”这个词来描述这个公司的销售情形。     相反,如果我们不从增长率这个初始数据出发,而改用增长率的增长率来表示,那么,情况就会发生根本性的改变。如果销售额在第1年增长了1%,第2年比第1年又增长了1.49%,那么,第2年的销售额比第1年的销售额拥有令人骄傲的成绩:增长了49%!     虽然这种计算方法从数学角度来看没有任何瑕疵,但是事实却被完全颠倒了。如果我们听到销售增长几乎达到50%的信息,那么我们几乎不会再去想上面所提到的初始数据究竟是怎样一回事,因为现实中有许多人搞不清楚增长率和增长率的增长率之间的差异。即使是一些从事经济新闻报道的记者和编辑也不例外,例如《柏林日报》(Berliner Zeitung)中的一段报道就足以说明这个问题。这篇报道的题目是“下一年物价会少涨一点吗?”,文章说:     1992年,在联邦德国的9个州中,价格上涨率平均水平是12%。从1993年开始,这9个州的物价上涨率大约可能达到7%,与1992年的物价上涨率相比,几乎是1992年的一半。这是位于汉堡的经济研究所在其最新经济景气报告中得出的结论。     用另外的话来说,实际上下一年度根本不是“微微比上一年少贵一点儿”;物价还在继续上涨,只不过不再像上一年度那样快而已。     因此增长率的增长率是统计学家的“毒药柜”。他们既可以把一个平淡无奇的数据吹嘘夸张成为让人为之激动不已的指标,又能够把正面的、良好的数据全部淹没在一大堆看起来丝毫没有任何价值的指标中。通常来说,统计学家并不使用真正的、真实的基础数据。     除此以外,统计学家还要进一步受制于各种变换形式的可能性,也就是说,受制于增长的百分点与增长率之间的变换可能性。如果缴纳的法定健康保险基金(Krankenkassen)保费比率从全部收入的12%提高到13%,那么,它就增长了1个百分点,或者说是增长了1/12,即8.3%。然而,这种区别对于我们许多人来说是搞不清楚的。

>统计数据的真相

统计数据的真相
作者: 瓦尔特.克莱默
isbn: 7111255119
书名: 统计数据的真相
页数: 185
译者: 隋学礼
定价: 32.00元
出版年: 2008-12