全书

Ying

章节名：全书
2013-07-07 21:43:11

令人惊讶的是：胜利者是所有提交策略中最简单的一个策略，它就是“一报还一报”。这个策略首先在第一步合作，然后就模仿对方上一步的选择。第二轮计算机竞赛有更多的参赛程序，它们是由一些业余爱好者和专家们提送的，他们都知道第一轮计算机竞赛的结果。然而，第二轮又是“一报还一报”取胜！对竞赛数据的分析揭示了一个成功的决策规则所应有的四个特征：只要对方合作你就合作以避免不必要的冲突；面的他人的无理背叛你是可激怒的；在给挑衅以反击之后你是宽容的；行为要简单清晰，使对方能适应你的行为模式。

引自全书

Once a cheater, always a cheater?

尽管事实上任何改善“一报还一报”的企图都没有奏效，单还是可以容易地找到这次竞赛的条件下能比“一报还一报”表现得更好的几个规则。这些规则的存在可以给轻信“以牙还牙”肯定是最好的策略的人一个警告。至少有三个规则如果参赛的话将赢得竞赛。这个简单的程序只有在对方前两步连续背叛后才背叛。它是“一报还一报”的更加宽容的版本，它从不惩罚孤立的背叛。这个“两报还一报”(TIT FOR TWO TATS)规则的出色表现揭示了参赛者的一个共同错误，即预期相对于“一报还一报”更少点宽容能得到更多好处。然而，事实上，更多的宽容才能得到更多好处。这个惊人的发现表明，即使是战略专家也没有给宽容的重要性以足够的重视。以上补充规则的分析结果支持了从分析参赛规则本身所得到的观点：即参赛者为了自己的利益太富于竞争性。首先，许多人在游戏中没有受到挑衅就早早地开始背叛，这个特点从长远看来是要付出大代价的。其次，任何参赛者所显示出来的宽容性比理想的要小得多（“唐宁"可能是例外）。第三，最与众不同的规则”唐宁“，由于对其他人的反应所作的初始假设太悲观而做了不少蠢事。检验者是由戴维·格拉德斯坦提交的，在竞赛中名列46名。它被设计成专门欺负软骨头。但是一旦对方表示出不可欺负性，它就罢手。这个规则的不寻常之处是为了检验对方的反应，它在第一步就背叛，如果对方背叛，它就赶快抱歉，回之以合作，然后在其余步中采用”一报还一报“ 。如果对方步反应它的第一步背叛，它就在第二步和第三步合作，但是在而后的步中它就每隔一步背叛一次。“检验者”在那几个在第一轮竞赛中可能取胜的补充规则对局时占了不少便宜。......实际上如果它们像“一报还一报”及那些名列前茅的程序那样在第二步就立即用背叛反击“检验者”的话，它们的处境就会好很多。这可以使得“检验者”赶快抱歉，而后的情况就好多了。

引自全书

一个“小人”的世界很容易被一小群“一报还一报”侵入。合作可以在甚至绝对背叛的世界中出现。如果只由一些散乱的个体去努力，合作时步能建立的。因为他们没有机会彼此相遇。但是，只要有识别能力的个体之间有即使是很小的比例彼此相遇，合作就可以从这个小群体中出现。在持续的重复囚徒困境中英如何表现，下面是四个简单的建议：1 不要嫉妒 2 不要首先背叛 3 对合作与背叛都要给予回报 4 不要耍小聪明

引自全书

尽管一报还一报一直很成功，但它还不能称为重复囚徒困境的理想策略。首先，一报还一报以及其它善良策略要在未来影响足够大时才有效，但是即便这样，也没有能独立于其他人所采用的策略的理想策略。在一些极端的情况下，如在没有足够的其他人回报它的最初合作的情况下，即使是一报还一报也做得很差。一报还一报确实有它的弱点。比如，对方一旦背叛，一报还一报就以背叛回报，如果对方做出同样的反应，结果将是无止境的交替背叛。在这一点上，一报还一报是不够宽容的。但是，一报还一报对待那些完全不反应的规则，如纯随机规则，又太宽容了。然而在众多设计来取胜的复杂策略所组成的多样性环境中，一报还一报确实表现得很好。

引自全书

660人阅读

> Ying的所有笔记（80篇）

说明 · · · · · ·

表示其中内容是对原文的摘抄