豆瓣
扫码直接下载
读过 合作的进化
令人惊讶的是:胜利者是所有提交策略中最简单的一个策略,它就是“一报还一报”。这个策略首先在第一步合作,然后就模仿对方上一步的选择。第二轮计算机竞赛有更多的参赛程序,它们是由一些业余爱好者和专家们提送的,他们都知道第一轮计算机竞赛的结果。然而,第二轮又是“一报还一报”取胜!对竞赛数据的分析揭示了一个成功的决策规则所应有的四个特征: 只要对方合作你就合作以避免不必要的冲突;面的他人的无理背叛你是可激怒的;在给挑衅以反击之后你是宽容的;行为要简单清晰,使对方能适应你的行为模式。引自 全书 Once a cheater, always a cheater? 尽管事实上任何改善“一报还一报”的企图都没有奏效,单还是可以容易地找到这次竞赛的条件下能比“一报还一报”表现得更好的几个规则。这些规则的存在可以给轻信“以牙还牙”肯定是最好的策略的人一个警告。至少有三个规则如果参赛的话将赢得竞赛。 这个简单的程序只有在对方前两步连续背叛后才背叛。它是“一报还一报”的更加宽容的版本,它从不惩罚孤立的背叛。这个“两报还一报”(TIT FOR TWO TATS)规则的出色表现揭示了参赛者的一个共同错误,即预期相对于“一报还一报”更少点宽容能得到更多好处。然而,事实上,更多的宽容才能得到更多好处。这个惊人的发现表明,即使是战略专家也没有给宽容的重要性以足够的重视。 以上补充规则的分析结果支持了从分析参赛规则本身所得到的观点:即参赛者为了自己的利益太富于竞争性。首先,许多人在游戏中没有受到挑衅就早早地开始背叛,这个特点从长远看来是要付出大代价的。其次,任何参赛者所显示出来的宽容性比理想的要小得多(“唐宁"可能是例外)。第三,最与众不同的规则”唐宁“,由于对其他人的反应所作的初始假设太悲观而做了不少蠢事。 检验者是由戴维·格拉德斯坦提交的,在竞赛中名列46名。它被设计成专门欺负软骨头。但是一旦对方表示出不可欺负性,它就罢手。这个规则的不寻常之处是为了检验对方的反应,它在第一步就背叛,如果对方背叛,它就赶快抱歉,回之以合作,然后在其余步中采用”一报还一报“ 。如果对方步反应它的第一步背叛,它就在第二步和第三步合作,但是在而后的步中它就每隔一步背叛一次。“检验者”在那几个在第一轮竞赛中可能取胜的补充规则对局时占了不少便宜。......实际上如果它们像“一报还一报”及那些名列前茅的程序那样在第二步就立即用背叛反击“检验者”的话,它们的处境就会好很多。这可以使得“检验者”赶快抱歉,而后的情况就好多了。引自 全书 一个“小人”的世界很容易被一小群“一报还一报”侵入。 合作可以在甚至绝对背叛的世界中出现。如果只由一些散乱的个体去努力,合作时步能建立的。因为他们没有机会彼此相遇。但是,只要有识别能力的个体之间有即使是很小的比例彼此相遇,合作就可以从这个小群体中出现。 在持续的重复囚徒困境中英如何表现,下面是四个简单的建议:1 不要嫉妒 2 不要首先背叛 3 对合作与背叛都要给予回报 4 不要耍小聪明引自 全书 尽管一报还一报一直很成功,但它还不能称为重复囚徒困境的理想策略。首先,一报还一报以及其它善良策略要在未来影响足够大时才有效,但是即便这样,也没有能独立于其他人所采用的策略的理想策略。在一些极端的情况下,如在没有足够的其他人回报它的最初合作的情况下,即使是一报还一报也做得很差。一报还一报确实有它的弱点。比如,对方一旦背叛,一报还一报就以背叛回报,如果对方做出同样的反应,结果将是无止境的交替背叛。在这一点上,一报还一报是不够宽容的。但是,一报还一报对待那些完全不反应的规则,如纯随机规则,又太宽容了。然而在众多设计来取胜的复杂策略所组成的多样性环境中,一报还一报确实表现得很好。引自 全书
Once a cheater, always a cheater?
> Ying的所有笔记(80篇)
表示其中内容是对原文的摘抄