博弈论:互动的决策论
- 章节名:博弈论:互动的决策论
博弈论(Game Theory)
冯•诺依曼:博弈论之父
1944年,出版《博弈论与经济行为》,标志着现代博弈理论的初步形成。
竞争需要通过一个具体的形式把大家拉到一起,一旦找到了这种形式,竞争各方就会走到一起开始一场博弈。
博弈:个人或组织在一定环境条件与既定规则下,同时或先后,仅仅一次或是多次选择策略并实施,从而得到某种结果的过程。
经济学角度的定义:博弈论是关于运用数学方法,研究双方或多方在竞争性活动中,制定最优化的胜利策略的理论。
策略:直接针对某一个具体问题所采取的应对方法。
博弈的4个要素:
(1)2个或2个以上的参与者
(2)要有参与各方争夺的资源或受益
(3)参与者有自己能够选择的策略
(4)参与者拥有一定量的信息
矩阵:博弈论中用来描述两个人或多个参与人的策略和收益的最常用的工具,又被称为“收益矩阵”或“得益矩阵”。
博弈论的生活价值:
可以指导我们把制定决策的依据,从抽象的教条与准则上转到对对手的认识和理解上,把观察事物的角度,从自身的角度扩展为各个参与者的角度。
如何出策略,不是由你决定,而是由你所交往的对手,以及对手怎么看待你的策略所决定的。
广义的对手:指包括你的搭档和敌人在内的一切与你进行博弈的另一方。
零和博弈(完全对抗,强烈竞争):一个参与者所得=另一参与者所失
负和博弈:一个参与者所得<另一参与者所失
正和博弈:一个参与者所得>另一参与者所失
(既有对抗又有合作,参与者的目标不完全对立,参与者可以同时有所得或有所失)
第二部分 模型与策略选择
一、囚徒困境:如何破解背叛
如果所有参与人都有优势策略,那么博弈将在所有参与人的优势策略基础上达到均衡,这种均衡称为优势策略均衡。
在“囚徒困境”中,均衡点是建立在两个囚徒相互背叛的基础上的,并且两者的相互背叛还可以获得一定的利益(从宽惩罚),如果没有这一利益条件,这个严格优势也就不复存在了。
人们对某种权利表现得忠诚,实际上并非偏好使然,而是人们服从了一种被选择的纳什均衡。
如果博弈双方可以相互沟通,那么他们可以协调彼此的行动,以避免意外发生,这被称为协调博弈。
二、人质困境:多个人的囚徒困境
仅仅用道德的呼唤来让人们挺身而出与邪恶作斗争是不现实的。而且,要任何一个人在“人质困境”中首先采取行动并独自承担其后果,也是不公平的。
从个体利益出发的行为,往往不能实现团体的最大利益,最终也不一定能真正实现个体的最大利益。
如何摆脱“囚徒困境”?
答:与对手联合,以提高自己收益;用策略来挟持对手,利害关系永远比道德更有效,不需要友谊的合作往往比需要友谊的更为可靠。前提是展现出自己可以随时报复的能力(关键点在于释放进行惩罚的信息),以吓阻对手的背叛尝试。
用圈子来保证合作
圈子的出现,实际上就是把彼此之间的双边关系,放进了多边关系中来考虑。一个社交圈子当中强有力的监督和惩罚体系,会迫使每个人更愿意遵守道德。
三、重复博弈:天长地久的聪明策略
没有未来必然背叛:
在博弈中,表现最好的策略直接取决于对方所采用的策略,特别是取决于这个策略为发展合作关系留出了多大的余地。
人与人的长期交往,是避免短期冲突、走向协作的重要机制。
带剑的契约才有效
法律就是通过第三方实施的行为规范,其功能首先是改变博弈的结果——改变当事人的选择空间,其次通过法律不改变博弈本身。而改变人们的信念或对他人的行为预期,从而改变博弈的局面。
用道德来保证均衡
道德也是对某些不合作行动的惩罚机制哈,这种机制的出现使得人类从“囚徒困境”中走了出来。
长期交往的合作压力
合作的基础与其说是信任和友谊,还不如说是关系的可持续性。只有当人们有着值得重视的未来,才能保证稳定持续的合作。
哈佛大学心理学家丹尼尔•吉尔伯特说,“在通过自己预见性的望远镜来窥探未来的时候,近处的清晰和远处的模糊会让我们犯下各种错误。”
费边主义的策略
一锤子买卖失败的可能性,远远大于细水长流的小笔交易。这种把一次决战变成长期交手的策略,称之为“费边主义”。
宽恕会导致更多背叛
如果在博弈一开始的时候就能做出可信的报复威胁,使背叛者认为最后一定不会被宽恕,反而会达到不出现背叛的效果。
合作来自于报复能力
最好的办法是向你的敌人展示,你能够在一场打击后还击,而不是向他表明你能在打击后幸存。
四、出来混总是要还的
从一报还一报到定然律令
你愿意你行的成为普世性法则,那你就可以将之定为你的行为准则。
使博弈能够持续、能够变成更大范围内的重复博弈的思维:在很多博弈中,我们不仅是在为自己做决定,也是在为其他可能的参与者确立参考坐标。
“拟奇想式”思考
人们认为通过采取某种行动,能够影响对方的行动。一旦人们被告知对方的选择,反而会意识到自己不可能改变对方已经作出的决定。
再一再二不再三
开始合作,继续合作,计算在你合作的情况下对方看上去背叛了多少次,假如这个百分比变得令人难以接受,转而一报还一报策略。
当某一背叛行为看上去像是一个错误而非常态举止的时候,你应该保持宽容之心。必须记住的一个重要原则是,假如有可能出现误会,不要对你看见的每一次背叛都进行惩罚,而要采取“再一再二不再三”的策略。
要学会以直报怨
所谓“直”,就是公正的原则,以直报怨就是按照事情本身的是非曲直,公正地回报对方的背叛。
吃小亏占大便宜
要做到输战役,赢战争,就必须有全局优先考虑观念。老子说,夫唯不争,故天下莫能与之争,所反映的就是这种智慧。
赢家通吃并不理性
这必然会导致背叛。即便现在不出现,也必然会在未来出现。
五、酒吧博弈:成功属于明白人
对于处身于一个混沌系统中的个体来说,在无法预测的过程中采取恰当的策略,往往可以趋吉避凶。在这样的策略中,少数者策略是值得重点关注的。
一加一未必等于二
要想把哪个东西搞坏,不要骂它,不要臭它,而是让它无限制地繁殖泛滥,结果它自然就名声扫地了。
千里长堤溃于蚁穴
一个非线性的混沌系统,一旦超越了它的多样化临界点,就会发生爆炸性的变化:而且原来的平衡一旦被打破,就不可能自行恢复。
一个人的实力再弱,只要没有弱到不堪一击的地步,那么他就有可能通过合适的策略,成为笑到最后的人。
六、枪手博弈:打仗弱的不一定输
在多人博弈中,常常由于复杂关系的存在,而导致出人意料的结局。一个参与者最后能否胜出,不仅仅取决于他自己的实力,更取决于实力对比关系以及各方的策略。
怎样选择优势策略
假如你有一个优势策略,请照办,不要担心你的对手会怎样做,假如你没有一个优势策略,但你的对手有,那么就当他定会采用这个优势策略,相应原则你自己最好的做法。
向前展望,倒后推理
相继出招的博弈有一个总的原则:每一个参与者必须预计其他参与者接下来会有什么反应,据此盘算自己的最佳招数。
集中优势才能获胜
学会置身事外
你的处世水平当然就上升到了一个更高的档次。其目标是为了在冲突的最初阶段更好地保护自己,并且在将来挺身入局的时候,能够占据更为有利的地位,进而更好地掌握这个局面。
七、猎鹿博弈:合作是为了利益最大化
人们争持不下甚至造成两败俱伤,根本原因就在于各方的行动都是在相互独立的。缺乏协调,往往会使双方失去共赢的机会。
如何保护公共资源
如果社会上每一个人都在追求自己的最大利益,毁灭将成为大家不能逃脱的命运
“公地悲剧”
古希腊时期哲学家亚里士多德发现,“凡是属于最多数人的公共事务,常常是最少受人照顾的事务,人们关怀着自己的所有,而忽视公共的事务;对于公共的一切,他至多只留心到其中对他个人多少有些相关的事务。”
八、智猪博弈:事半功倍的顺风车
占优势时更应保守
跟在别人后面第二个出手有两种办法:一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证明成功或者失败以后再说。
局面不利要冒险换牌
当我们在博弈中处于不利地位时,冒更大的风险去换牌是优势策略。而当自己处于有利地位时,采取保守策略,跟着对方出牌则是明智的。
九、警察与小偷博弈:猜猜猜与变变变
让对手琢磨不透你
策略应当是随机的,不能让对方知道自己的策略,哪怕是策略的倾向性。一旦对方知道自己采用某个策略的可能性增大,那么自己在游戏中输的可能性也就增大了。
十、斗鸡博弈:让对手知难而退
十一、协和谬误:有舍有得的人生策略
不要在失败中越陷越深
我们常常由于想挽回已经无法收回的东西,而做出很多不理性的行为,从而陷入沉默成本的泥潭。
所谓“沉默成本”,是指业已发生或承诺、无法回收的成本支出,比如因失误造成的不可收回的投资。
十二、蜈蚣博弈:从终点出发的思维
十三、分蛋糕博弈:把自己变成谈判高手