我有85%的信心说：看了这篇笔记，可以不用读原书了。

Item: 超预测
Rating: 4
Author: 九四一方

2016-10-11 18:41:13

首先，根据我的习惯，我先把书名改一下，原书名为：《超预测：预见未来的艺术和科学》，我改为：《不太重要的国际政治事件是否发生问题的预测方法探讨及引申》，这个改法，是因为原书中只是分析的「是否问题」，而且是「国际政治事件」，除了是否问题，还有很多其他问题，除了国际政治事件还有很多其他事件，所以，这两个特殊性不能代表一般情况下的「预见未来」，我这么改，也是免得大家对这本书的期望值太高。好了，这本书讲了什么？作者研究了好多年的预测。一开始是一个EPJ项目，即 Expert Political Judgment （专家政治预测项目），由几百名专家来预测一些政治事件。最后却发现，总体而言，这些专家等于瞎蒙，作者也很无奈，不过作者理性分析之后发现，虽然总体的平均水平等于瞎蒙，但是有一些专家的确好于另一些专家，于是作者在想这背后的区别是什么。后来有了一个机会：加入精准预测项目，就是举办比赛，让大家来预测，然后评比，谁预测的准就发奖，这个项目得到了情报高级研究计划局的几千万经费支持，本来这样的机构是不会支持的，因为他们本来就是干这个的，怎么会花钱请人来做这事的，万一干的比自己还好，自己多没面子，他们这之所以以支持是因为过去几年有两件事让他们名誉扫地：一是没有预测到911事件，二是错误地预测了萨达姆的武器情况（坚称有大规模杀伤性武器，最后发现根本没有）。这个2800人参与历时五年的精准预测项目，让作者发现了一个算法，一批牛人。这个算法是：极端化算法，这批牛人称之为「超级预测家」。因此作者就写了这本书，那么这个算法是什么，牛逼在哪里？这些超级预测家又是怎么回事？咱们先来看几个关于预测的问题：问题一：要预测的问题（东西/目标）要清晰准确，而且预测的问题难度要适中，即宜居带问题。比如，用模糊的语言表述的问题很难说清，时间框架不明的问题，也没法说，就像「我会公布的！到底时候公布呢？我会公布的！合适的时候！」对于的问题，你去预测它，永远预测不准，因为它本来就是不清不楚模模糊糊的，最后往往就是每个人的自证预言。每个人都说，看吧，我说对了吧哈哈！问题二：好的评估方法 ·比尔盖茨说：重要的评估手段对改善人类状况的意义让我震惊，如果你树立清晰的目标，制定有助于实现目标的评估方法，你就可以获得难以置信的进步，这似乎是基本的道理，但令人吃惊的是，人们经常做不到这一点，或者很难正确执行。当外科医生最终承认他们的经验和学识不能作为判断某种治疗手段是否有效的可信依据时，他们求助于科学实验，医学终于开始突飞猛进。 1950年，格伦·W·布莱尔创建了一种评分算法，即布莱尔得分。得分范围为0-2，分值越低说明预测能力超强，比如A事件会发生吗？如果你提交一个发生概率为0%的答案，如果最后没发生，得分为0，如果发生了得分为2. 而如果永远猜50%，那分得分就是0.5分。问题三：人类的判断系统：潜意识和思维的双系统模型第二系统是我们熟悉的思维领域，第一系统不为人熟知，这片区域属于无意识感知和认知活动。前者可以称为逻辑，后者为心理逻辑，心理逻辑是这样运作的：如果感觉正确，那就是正确的。第一系统急于对未解之谜和不确定现象做出确定无疑、过分自信的结论，而不是花时间多加思考，否则认知负荷太重了，这可能与人类长达几万年的丛林生活经历有关。而科学领域的谨慎与这种人类天性是相悖的。第一系统还常常受到转换的诱惑，将原有问题转换为自己想当然的问题，比如原问题是：气候变化是真实现实吗？可能容易转换成：大多数气象学家认为气候变化是真实现象吗？这个问题。问题四：合理性与正确性判断/决定/决策/预测，它们的合理性与正确性，完全是两个概念。比如，你的判断是80%会发生，最后没有发生，这个判断是错误的，但你能说这个判断不合理吗？不一定，要看这个判断是如何做出的。问题五：刺猬型预测 v.s. 狐狸型预测刺猬武断而自信，总是给出极端的猜测，如100%！ 0% ！对则非常对，错则错得离谱。但是他们在媒体上很受欢迎，因为他们讲述了一个(看上去)逻辑严密，情节简单的故事，抓住了观众的心，”内容要简单，傻子都能听懂”，刺猬的简单和自信有损他们的预见能力，但能够放送神经，这对他们前途有利。而狐狸却很谨慎，面对媒体时没那么轻松自如，更缺少自信，不太可能用「肯定」或「不可能」这样的词，更有可能躲在「也许」的阴影之下，他们的故事不容易理解，言谈中随处可见「但是」和「另一面」，但这才是好的预测，至关重要的预测。问题六：超级预测家为什么这么牛逼？运气还是能力？智商还是方法？ · 运气和能力，智商和方法都有，但能力和方法更重要一些。 · 有一些人的事迹，的确是纯运气使然，比如有人操盘连续6年强于市场平均水平，记者开始追捧，声称单靠运气的可能性多么小，最后得意宣称是能力使然，记者的问题出在哪里？他忽视了过去六年有多少人尝试这位杰出人才做出的事情，如果人数成千上万，一定会有人连续6年蒙的很准。这便是幸存者偏差，比如你为什么不好奇一件事情：即，你的爷爷有儿子，你的爷爷的爷爷也有儿子，你爷爷的爷爷的爷爷也有儿子，一直往上追溯，一直有，这概率多小啊。 · 是运气还是能力，有个方法可以检验，如果是运气，再观察一些数据，一定会回归均值，即「均值回归检验」，这是一个检验运气的好工具，如果很快就回归到了均值，那么先前的成功是运气使然。费鲁奇认为权威模式将会过时，过去人们倾听知名专家的建议，但这些专家如何成为专家的呢？他们只是因为在大媒体平台上说了一些掷地有声的模糊的主观判断就出名了。今后这种现象会越来越少。在精准预测项目中发现的那个牛逼的「极端化」算法是什么呢？ 1）找几百人，让让他们做一些验证性的测试题让他们来预测，根据这些题筛选出预测能力强的几十名。 2）给这些强者赋予高的权重。 3）之后每一次都收集所有人的答案，然后求一个加权平均值。 4）然后在加权平均值的基础上进行极端化处理，如最后的值为0.3，则极端化为0.2，如果最后的值是0.7，则极端化为0.8. 在为期五年的项目中，第一年的冠军就是采用这种算法。从第二年开始，作者从第一年成绩高的选手里组成了「超级预测家」团队，最后这些团队越战越猛，到第五年的时候，他们的预测能力大大提升，那么这些超级预测家是怎么做的？概括来说，将解决问题的过程分解为若干部分，尽可能明确区分已知信息和未知信息，认真考虑所有假设，借鉴外部视角，把问题置于比较视野下，淡化其特殊性，同时将其作为广泛的同类现象中的特例进行处理，然后通过内部视角分析问题的特殊性，此外，研究自己的观点与他人观点的异同，综合所有视角，吸取群体智慧，达到蜻蜓复眼的效果，形成自己的判断，尽可能精确表达你的见解运用细分概率作为结论。而且在收集证据时，注意避免反应不足和反应过度的陷阱，同时勤于更新，但每次更新都只是迈小步，尝试、失败，分析，调整，再尝试，这是一个永不停息的过程。具体来说： 1、看看这个要预测的问题是什么。一要区分哪些是可以预测，哪些是不可以预测的。二要区分哪些是周期变化和线性变化，哪些是随机事件，，钟表问题和云朵问题要避免，前者用公式就能知道，后者不可能知道，比如任何人无法推断十年后的市委书记是谁。有针对性地区分之后，才可以集中精力处理难度适中的问题，才可以获得最大收益。 2、拿到一个好的问题之后，首先明确两个时间：一是提交答案的截止时间点，来推算有多长时间施展预测，二是问题本身所对应的时间，这个问题指向的是一个时间点，还是一个时间段？具体的时间是多少？比如2016年总统大选谁会胜出？这个问题指向时间点，有具体的时间即2016年12月17日。2017年会不会有一天谷歌市值能超过苹果？这个问题对应一个时间段，2017年一整年。 3、费米的启示：问题分解。费米以预测准确著称，他经常对一些问题做粗略的计算(如芝加哥有多少钢琴调音师这样的），然后得出某个数值，随后的评估表明，他的结果准确度非常高。他采用的方法是将问题分解成几个小问题，然后依次回答几个小问题。将看似棘手的问题分解为容易处理的子问题。要学习费米的工作方法，将问题逐层分解为可知和不可知的部分，对未确定答案的部分提出自己的假设并进行大胆的猜想，勇于试错。这种方法可以将问题分解成若干可预测的子问题，从而提高最终预测结果的准确度。 4、先外后内一开始不要衩被任何细节束缚，先采用外部视角，即我理解的「同位人」，统计学家称之为「基本比例」，即某种事物在同类中的普遍程度，比如告诉你一个家庭，这个家庭有一些基本信息，问你，他们家养宠物了吗？如何回答？先不要急于分析这个家庭的细节信息，比如根据爸爸的名字推断是什么种族的，然后看这个种族对于宠物的喜好什么的，先来看一睦美国所有家庭有多少家庭养宠物了？62%。这便是外部视角，然后再转为内部视角，来调整这个数学。当然，外部视角也可能有多个，这取决于如何判断什么是外，什么是内，界线在哪里。因此，有可能会参考多个外部视角，但请注意，第一个外部视角非常关键，因为这会根据这个外部视角来做出第一个判断。这第一个判断就是一个「锚」，后边的调整都会受到它的影响，即锚定效应。比如芝加哥有多少钢琴调音师，第一个外部视角是芝加哥有多少人？我对于芝加哥不了解，只知道北京大概是2000万人，上来就给了芝加哥1000万人的猜测，这是一个坏锚，因为芝加哥实际人口200多万。 5、正反合法。转换到内部视角后，要寻找出每个问题中发生作用、相互冲突的因果各方，如果会发生，应该有哪些条件？如果不会发生，应该有哪些条件？在古典辩证法中，命题与对立命题相遇，产生的是综合性命题。这也是矛盾的对立统一规律。每个出色的预测论证通常都伴随着一个至少应该承认其存在的反面论证，将其融合才能更好地发挥预测效能。 6、博采众长，蜻蜓复眼式的集体智慧。寻找其他视角，然后整合到自己的视角中，达成蜻蜓复眼的效果，研究人员发现，要求人们假设他们的初始判断是错误的，然后认真思考错误的原因，接着做出新的判断，产生第二次预测，并与第一次相结合，仅仅做到这几点，就能大幅提高准备性。经常这样做的人拥有的是主观开放的思维，对这些人来说，观念是要接受检验的假设，而不是要护卫的珍宝。不过，这样很累，因为大脑不得不高负荷运转。和他人讨论，收集尽可能多的视角，然后综合起来做出第一个预测值，预测值一定要以概率形式，而不是二分形式。上边提到的极端化算法要想发挥作用，必须有一个前提，即：多样性。因为极端化算法是基于「集体智慧」的，如果这个集体是非常同质化的集体，那么极端算法极为可能大错特错。引申：超级预测家们人非常喜欢概率，一般人说某件事的可能性的时候，往往用10的倍数，比如30%或40%，但超级预测家往往会用35%，甚至37%这样细分程度很高的数字。概率具有根深蒂固的反直觉天性，在大众看来，科学家创造事实，随着采集事实的工作深入情节开，不确性被赶走，科学的终极目标就是完全想根除不确定性，但是这只是19世纪的科学观，20世纪科学的一项伟大成就就是，证明了不确定性是现实世界中不可根除的元素，绝对确定性才是虚幻的，所有的科学知识都是暂时性的。概率思维v.s.天意思维具有概率思维的人运用外部视角来分析属性完全确定的事件，将其视为以准随机抽签方式出现的可能，而这样的可能不止一样。具有天意思维的人遇到悲剧，就会思考：为什么是我？为什么不是我 7：频繁的小幅更新，在Deadline之前，不停的收集新的正反证据，来更新之前的判断，当然要避免对于证据有不恰当的解读：反应不足或反应过度。 8：无止境的练习。有一种计算机程序永远没有最终版本，一直是贝塔版。在预测这件事上也是如此。尝试，失败，分析，调整，再次尝试，永无止境的循环。但是，这里有两点： 1)、永不停息意味着你要有很强的韧劲，否则几个循环下来你会坚持不了了。 2)、「尝试，失败，分析，调整，再次尝试」这个过程，如果去掉分析和调整，就只剩下「尝试->失败->再尝试」这样的循环了，如果只有这个循环，任何有一个有情感有血有肉的人都不会坚持太久，而如果分析错了，调整错了，和没有分析没有调整是差不多的，因此，正确的分析和调整极为重要，如何才能做到呢？关键在于要有「明确的、及时的反馈」。对，既要明确又要及时。唐·摩尔做过一项研究，有多年工作经验的警察，有大量时间审问嫌疑犯，那么，他们是否有很强的辨别能力？辨别嫌犯有没有说谎？研究结论显示，他们的准确度的确在提升，但提升的速度小于他们自信增长的速度，也就是说，他们非常自信的认为经验越多，识谎技能越高，但往往是不对的，信心与能力出现的鸿沟，这项鸿沟是非常常见的，但是在两个群体上却没有：气象学家和桥牌高手。因为他们都能获得明确的、迅速的反馈。气象学家预测第二天有暴雨，如果他醒来看到阳光普照，他就知道自己预测错误，桥牌选手在每一盘结束时就会知道结果，如果预测失败，他们马上就知道。所以，这里的关键是：你的目标，你的判断，你的反馈都必须有非常明确的语言来表述，还有一点，时滞要小，反馈要及时，否则人们很容易忘记。而在多数时间这两点是不具备的，应该怎么办？ 1，尽可能找到精确语言来表述，2，记录下来，并且要有长远思维，过了很久之后，还能记得去回收反馈信息，即长期观察。以上就是超级预测家用的方法，但是实际中还有三个问题： 1、「谁领导谁」立场利益问题，预测术关乎的是准确真实，然而实际情况中总是有一个「谁领导谁」立场利益问题。2012年，总统大选，奥巴马v.s.罗姆尼，有一个人曾经是比尔·克林顿的顾问，他预测罗姆尼将大获全胜，事后证明他说错了，很多人开始嘲笑他，他回应说：罗姆尼的竞选运动在走下坡路，人们对他的支持率下降，没有人认为他还有机会，这个节骨眼上，我必须站出来。然后，在医学发展史上，有人克服了这个障碍，一个世纪以前，医生的专业化程度越来越高，一位叫科德曼的医生提出一个理念，即终结果系统，医院应该纪录每一个病人的各种情况，最后治愈情况，这些数据要公开。然后这非常不利于医生现在的职业利益，一开始没人理他，但是他完全站在病人的角度，当行业人士和民众了解了科德曼的理念后，越来越多的医院采用了他的设计。 2、真正重要的大问题不可预测，可预测的都是不太重要的问题。没关系，可以将真正重要的大问题近似的拆分为几个小问题。如第二次朝鲜战争会发生吗？这个问题是大问题，但不可预测，可以拆分为一个问题集，包括：导弹试验会进一步有吗？核试验还会有吗？网络攻击还会有吗？炮击还会有吗？分析这一系列小问题，来近似拟合大问题，「贝叶斯问题集」，这很像点彩画法，在画布上轻轻涂上小圆点，不再添加其他任何元素，每个小圆点都独立的，但随着越来越多的圆点聚集在一起，图案就显现出来了。 3、超级预测家v.s.超级提问者有的问题很烂，有的问题很精妙。这个问题前边说过了。有了超级预测家，想不想把这些人编为一个团队呢，想不想来领导这个团队呢？这就引出了书中后面几章的内容： 1、组团还是不组团，如何发挥团队的智慧？肯尼迪政府在猪湾事件和古巴导弹危机事件中表现非常不同，前者糟糕，后者优秀，然后这其实是同一个团队，后来做了什么调整呢？前者的失败，是集体迷思的体现，任何有凝聚力的团队，其成中往往会无意识地产生若干共识，但这些共识往往是错误的观念，进而根据这些错误的观念制定一些准则，最后的结果可想而知，但是每个人不会提反对意见，因为这样让他们安心，「我们不可能都错了，对吧？」那就是对了。猪湾登陆全军覆没后，肯尼迪下令调查原因，为什么局面这么糟糕？报告认为「令人舒心的一致」是关键问题，建议改变决策过程，「怀疑精神」成为新的口号，。。。引入外部入中，暂时放弃等级制度，在合理范围内限制领袖的观点。 2、如何成为超级领导？毛奇的启示。毛奇是一名军人，他分别于1864年打败丹麦，1866年打败奥地利，1871年打败法国，他是怎样领导军队的？他鼓励军人勤于思考，对接到的命令提出质疑，甚至批评它，如果确有必要，可以违抗命令。二战早期，德国的军队基本上参照毛奇精神的，但是他们也非常明确思考和执行的界线，一旦决策确定，思维模式就要随之变换，忘记不确定性和复杂性，全力投入执行。二战后期，希特勒抛弃了毛奇的思想，而美国的艾森豪威尔却接过了大旗。。。美军胜利的关键是战地指挥官可以行使制定关键决策的权力。领导三要素，要非常自信，要非常决断，要懂得描绘蓝图。而这与超级预测家是相反的，超级预测家不自信，甚至无关自信，他们相信冰冷的事实，相信数字，非常谨慎，非常不决断。真正的领导要平衡这两种能力，既是一个思考者，也是一个行动者。任务导向系统：我们让员工知道我们希望能够实现的目标，但是，这个但是非常重要，我们不告诉他们如何实现这些目标。这是对任务导向系统接近完美的概括。而且还要有谦卑，但不是一味的谦卑，而是明知的谦卑，保持明智的谦虚的人认为，现实世界极其复杂，认清事物的真相始终是一项永恒的挑战，所以人类的判断一定错误百出。本书还有两个博弈论彩蛋： 1、安妮杜克是德州扑克大师，他说在打牌的时候，大家都知道有三种操作选择：弃牌，跟注，加注。当其他牌手加注时，你可能会觉得他有一副好牌，但这是一个误解，想一想，如果你有一幅很好的牌，你会加注吗？你不会，因为加注会吓跑其他牌手，因此他加注不一定说明他有幅好牌。 2、1997年《金融时报》猜数字游戏：参与者提供一个0-100之间的正整数，最后谁得奖呢？最接近所有参与者答案的平均值的2/3的数字会获胜！假如有几千人参赛，最后哪个数字谁获胜了呢？这取于所有参与者都猜了什么数学，他们都采用了什么策略。 1）如果他们全都瞎蒙，那么一定是随机分布的，那么平均值是50，那么33会获胜。 2）他们既然知道规则是均值的2/3，那么就不会随机猜，可能都会想到上边这一条，所以，可能大家都会猜33，如果是这样，那么22就会获胜。 3）但是如果你想到了以上第2条，难道别人想不到吗？继续！22的三分之二是15。 4）如果你想到以上第3条，那也会有人想到啊。。。。可是如果这样继续下去，最后的数字就是0了。问题就在于：这几千人中有多少人只想到了一步，有多少人想到了第2步，有多少人想到了第3步。。。。有多少人想到了尽头。如果你知道了这个分布，你就是赢家。如何知道这个分布？就是了解大众，了解主流的几个用户画像，了解主要分几种。 1997年实则获胜的数字是13。也就是说，想到第一步的人和第二步的人占多数，有一小部分人想到了终局，也就是 33 22 0 这些数学不同的配比然后平均得到的是18.91，最后18.91的三分之二是13. =====以上就是书的内容======= 最后我终于意识到，像我这样的人，唯一可能的「有较大比较优势的能力」可能就是对一些事物的预测能力了，而所幸的是，这个能力是可能不断提升精进的。

有关键情节透露