“囚徒困境”的起源、应用及演变

“囚徒困境”(Prisoner's Dilemma)是1950年美国兰德公司提出的博弈论模型。两个同案犯被抓,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱5年;若互相揭发,则因证据确实,二者都判刑2年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。
单次发生的“囚徒困境”结果必然是互相背叛。而多次重复的“囚徒困境”结果会不一样。在重复的“囚徒困境”中,博弈被反复地进行。每个参与者都有机会去“惩罚”、“报复”另一个参与者前一次的背叛行为。背叛的企图被受到惩罚的威胁所克服,这时,同守沉默的合作将会作为一个较好的均衡结果出现。
据海淀MING考证,“囚徒困境”和“重复困境”在我国早就有记录。宋洪迈《容斋随笔》卷十六《治盗法不同》记载:
唐朝崔安潜为西川节度使时,当地盗贼横行为祸,他张贴告示宣布:“告发和捕捉到一名盗贼,赏钱五百缗(一千文为一缗)。如果同伙告捕,则免其罪,赏钱和一般人一样多。”不久,有人送来了一个盗贼。盗贼很不服气地向告发他的人说:“你和我一同为盗十七年,赃物都平分,你怎么能捉我呢?”崔安潜说:“你既然知道已经出了告示,为什么不将他捉来?如果你把他捉来,那么他应当被处死,而你则要受到奖赏。现在你既然已经被人家告发了,就应当处死。”随即下令付给告发者赏钱,让盗贼亲眼看见,然后将这个盗贼在街市上处死。于是,盗贼们与其伙伴们相互猜疑,竟然在一夜之间纷纷散逃出境,从此境内再无一人为盗。
这件反生在公元900年左右的事件,就是较早的单次“囚徒困境”的实例。但是,俗话说“道高一尺,魔高一丈”,慢慢的盗贼们逐渐有了应对的措施。破解“囚徒困境”的办法有两个:1、一个人单独作案,没有伙伴就没有告发;2、三人以上团伙作案,这样,当有一个人出卖另一个人时,其他人就可以在事后残酷的惩罚那个告密者及其家人,有了几次这样的事情后,盗贼们就都会同守沉默而不敢告密,于是就形成了多次“囚徒困境”的博弈。
慢慢的过去了200多年,随着多次博弈,盗贼的团伙不断壮大,官府抓盗贼越来越难。难道就没有新的办法解决这个问题吗?《容斋随笔》中的这则《治盗法不同》的文章中记载了第二个故事:
北宋李公择治理齐州(今山东济南)时,齐地多盗贼,李公择严加治理,但是屡禁不止。有一次,李公择询问一名落网的惯犯关于齐州盗贼屡禁不止的原因,那个盗贼回答说:“这是由于富裕之家为他们作掩护的缘故。假如盗贼相互串通隐瞒,官府上门搜查,只要捉住一个窝藏犯予以重罚,借此杀一儆百,这样就可以没有盗贼之患了。”李公择说:“我有办法了!”于是,便下令凡是窝藏盗贼的人家被发现后,一律拆除房子。没过多久,盗贼就绝迹了。
将近900年过去了,20世纪末定居在以色列的阿拉伯人多次制造袭击以色列人的事件,案发后作案者会躲进阿拉伯人居住区,以色列警察冲进阿拉伯人居住区去抓人,可总是因为族人亲友的互相掩护包庇而很难有所收获。后来以色列政府想出了一个办法:哪个阿拉伯人犯了事,以色列政府调查到犯事者的姓名,警察就冲进他所在的居住区把他亲属家的房子拆了。这个方法非常奏效,袭击以色列人的事件慢慢的减少了。这个现代的案例几乎是完全模仿了中国北宋李公择的做法。
综上所述,“囚徒困境”也罢,“纳什均衡”也罢,“博弈论”也罢,其实都是起源于中国的。孔子早就说过:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎矣。”(大意:整天吃饱了饭,什么事也不做是不行的呀!不是有博弈这种游戏吗?搞一搞也是很好的) 《论语 阳货第十七》
单次发生的“囚徒困境”结果必然是互相背叛。而多次重复的“囚徒困境”结果会不一样。在重复的“囚徒困境”中,博弈被反复地进行。每个参与者都有机会去“惩罚”、“报复”另一个参与者前一次的背叛行为。背叛的企图被受到惩罚的威胁所克服,这时,同守沉默的合作将会作为一个较好的均衡结果出现。
据海淀MING考证,“囚徒困境”和“重复困境”在我国早就有记录。宋洪迈《容斋随笔》卷十六《治盗法不同》记载:
唐朝崔安潜为西川节度使时,当地盗贼横行为祸,他张贴告示宣布:“告发和捕捉到一名盗贼,赏钱五百缗(一千文为一缗)。如果同伙告捕,则免其罪,赏钱和一般人一样多。”不久,有人送来了一个盗贼。盗贼很不服气地向告发他的人说:“你和我一同为盗十七年,赃物都平分,你怎么能捉我呢?”崔安潜说:“你既然知道已经出了告示,为什么不将他捉来?如果你把他捉来,那么他应当被处死,而你则要受到奖赏。现在你既然已经被人家告发了,就应当处死。”随即下令付给告发者赏钱,让盗贼亲眼看见,然后将这个盗贼在街市上处死。于是,盗贼们与其伙伴们相互猜疑,竟然在一夜之间纷纷散逃出境,从此境内再无一人为盗。
这件反生在公元900年左右的事件,就是较早的单次“囚徒困境”的实例。但是,俗话说“道高一尺,魔高一丈”,慢慢的盗贼们逐渐有了应对的措施。破解“囚徒困境”的办法有两个:1、一个人单独作案,没有伙伴就没有告发;2、三人以上团伙作案,这样,当有一个人出卖另一个人时,其他人就可以在事后残酷的惩罚那个告密者及其家人,有了几次这样的事情后,盗贼们就都会同守沉默而不敢告密,于是就形成了多次“囚徒困境”的博弈。
慢慢的过去了200多年,随着多次博弈,盗贼的团伙不断壮大,官府抓盗贼越来越难。难道就没有新的办法解决这个问题吗?《容斋随笔》中的这则《治盗法不同》的文章中记载了第二个故事:
北宋李公择治理齐州(今山东济南)时,齐地多盗贼,李公择严加治理,但是屡禁不止。有一次,李公择询问一名落网的惯犯关于齐州盗贼屡禁不止的原因,那个盗贼回答说:“这是由于富裕之家为他们作掩护的缘故。假如盗贼相互串通隐瞒,官府上门搜查,只要捉住一个窝藏犯予以重罚,借此杀一儆百,这样就可以没有盗贼之患了。”李公择说:“我有办法了!”于是,便下令凡是窝藏盗贼的人家被发现后,一律拆除房子。没过多久,盗贼就绝迹了。
将近900年过去了,20世纪末定居在以色列的阿拉伯人多次制造袭击以色列人的事件,案发后作案者会躲进阿拉伯人居住区,以色列警察冲进阿拉伯人居住区去抓人,可总是因为族人亲友的互相掩护包庇而很难有所收获。后来以色列政府想出了一个办法:哪个阿拉伯人犯了事,以色列政府调查到犯事者的姓名,警察就冲进他所在的居住区把他亲属家的房子拆了。这个方法非常奏效,袭击以色列人的事件慢慢的减少了。这个现代的案例几乎是完全模仿了中国北宋李公择的做法。
综上所述,“囚徒困境”也罢,“纳什均衡”也罢,“博弈论”也罢,其实都是起源于中国的。孔子早就说过:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎矣。”(大意:整天吃饱了饭,什么事也不做是不行的呀!不是有博弈这种游戏吗?搞一搞也是很好的) 《论语 阳货第十七》
© 本文版权归作者 海淀MING 所有,任何形式转载请联系作者。
有关键情节透露