首页 >>  正文

博弈论66个经典

来源:baiyundou.net   日期:2024-08-27

作者:布欧buooou

文章字数:3000 

阅读时间:5分钟 

《合作的进化》是罗伯特·阿克塞尔罗德的一本博弈论经典之作,作者以“重复囚徒困境”游戏作为切入点,讲述了在与他者的持续交往中,应该选择怎样的合作策略才能得到较好的收益。 本书的一个重要结论是,人们相互作用越频繁,合作的可能性就越大。 本篇文章,是对《合作的进化》核心内容的总结。 

一、前言 

先从两个简单的问题开始: 

1、在与他人的持续交往中,人什么时候应该合作,什么时候只需为自己着想? 

2、一个人会继续帮助他的一位从来不思回报的朋友吗? 

合作,是我们常常要面对的事,小到个人,大到国家。合作虽然能带来好处,但并不总是能建立起来。 两国之间的贸易壁垒就是一个很好的例子。 显然,自由贸易对两国都能带来好处,但问题是,无论谁单方面取消壁垒,都会导致自己国家处于不利的贸易状态。 所以,无论一个国家如何做,另一个国家保持它的贸易壁垒总是比较有利的。因此,每个国家都有利益动机保持贸易壁垒。 同理,在人与人之间、公司之间的也会存在类似的场景,我们可以用一个简单的游戏来进行模拟,那就是著名的“囚徒困境”游戏。 

二、囚徒困境 

在“囚徒困境”游戏中,有两个对策者,每人都有两个选择: 合作或背叛,并且都需要在不知道对方选择的情况下做出自己的选择。 每种选择对应的收益如下图所示: 

从图中可以看出,当双方都选择合作时,集体收益是最高的6; 

当一人选择合作,另一人选择背叛时,背叛一方的个人收益是最高的 5。 

之所以称为“困境”,是因为不管对方怎么选择,从个人的角度,背叛都是更好的选择,而双方背叛却会导致最低的集体收益。 

从上述结论来看,背叛是必然的选择,那么为什么现实世界中,还会存在这么多的合作呢? 其实,上述结论的前提是,对策者双方只相遇一次,在只考虑当前回合的最大收益情况下,背叛是必然的。 但是,如果双方会在将来相遇多次,那么就要考虑后续的收益,情况将变得复杂,我们将这称为“重复囚徒困境”。 为了探讨“重复囚徒困境”下的最优策略,作者组织了重复囚徒困境游戏的计算机竞赛,并邀请众多博弈论专家参与。 

三、“一报还一报” 

在计算机竞赛中,参加者提交一个能给出每一回合策略(合作或者背叛)的程序,该程序在作策略选择时可以利用对局的历史。 竞赛是循环的,即每个程序都会与其他程序相遇,每轮比赛有 200 次对局,以此来模拟出“重复”。 竞赛的结果有点出乎意料,胜者是“一报还一报”策略,它是所有提交程序中最简单的策略,结果却是最好的。 “一报还一报”的策略是,最开始选择合作,随后按对方上一回合的选择去做,如果对方出现背叛,那么“一报还一报”也会在下一回合背叛来进行“报复”,但只会报复一个回合。 下图举例了“一报还一报”与其他策略的6个回合的对局情况: 

从上述例子来看,“一报还一报”策略在每一个对局之中都不是得分领先的一方,甚至在遇到全背叛策略A时6个回合的得分仅仅3分。 

但是,在单回合不占优的情况下,“一报还一报”依然在竞赛中却能获得胜利。 值得注意的是,在所有竞赛参与者中,善良策略(不首先背叛)的平均得分要比非善良策略(首先背叛)的平均得分高 25%!前 8 名的策略都是善良的。而在善良策略中,得分最低的是最少宽容性的规则,一个采用永久报复的完全不宽容的规则。“一报还一报”策略成功的原因,是它综合了善良性、报复性、宽容性和清晰性善良性防止它陷入不必要的麻烦; 报复性使对方试着背叛一次后就不敢再背叛; 宽容性有助于重新恢复合作; 清晰性使它容易被对方理解,从而引出长期的合作。 

四、合作 or 背叛,你怎么选? 

那么,在人与人相处的时候,我们应该怎么做呢? 作者给出了 4 点建议: 

1、不要嫉妒 

2、不要首先背叛 

3、对合作与背叛都要以回报 

4、不要耍小聪明 

1、不要嫉妒 

人们总是习惯考虑零和博弈,这种情况下,一个人赢,另一个就输,比如下棋。 但在现实生活中,大多数情况属于非零和博弈,也即可以双赢,也能双输。这种情况下,合作是可能的,但并不总能实现。 人们倾向于采用相对的标准,经常把对方的成功与自己的成功联系起来,从而导致了嫉妒。当嫉妒出现时,人会企图抵消对方已经得到的优势,通常通过背叛来实现。但背叛往往会导致更多的背叛,进而是双输的局面。因此,嫉妒无疑是自我毁灭。 要求自己比对方做得好,不是一个很好的标准,除非你的目的是消灭对方。 更好的做法是,把你所做的,与处在相同情况下的其他人所做的,进行比较。对于相同的策略,你是否已经做得最好了?其他人在这种情况下能做得更好吗? 因此,只要你自己能做得更好,就让对方做得和你一样或略好些,就像“一报还一报”在每个对局中并不是优胜的一方,但并不妨碍它能赢得竞赛的胜利。 我们没有理由去嫉妒他人的成功,因为在长时间的“重复囚徒困境”中,他人的成功是你自己成功的前提! 

2、不要首先背叛 

竞赛和理论分析的结果都表明,在非零和博弈中,善良策略是表现更好的一方,善良性能够避免不必要的冲。 非善良策略在开头还显得挺有希望,但是时间一长它就摧毁了它自己赖以成功的基础。 

3、对合作与背叛都要给予回报 

竞赛中,“一报还一报”的成功给我们一个简单且有力的建议:要回报对善良者报以合作,对非善良者报以背叛。 值得注意的是,在报以背叛时,我们要保持惩罚与宽恕的平衡。“一报还一报”总是在对方每次背叛之后只背叛一次,而不是永久背叛,因此它成功了。 但并不是说只背叛一次就是最优的,最优的宽恕水平与环境有关,如果周边绝大多数都是非善良的策略,那么,太多的宽恕反而会付出更多的代价。 

4、不要耍小聪明 

在“囚徒困境”的情形中,人们容易耍小聪明,然而复杂的规则并不比简单的规则做得更好,赢得竞赛的反而是最简单、最易理解的“一报还一报”策略。 原因主要在于,在零和博弈中(如下棋),对手任何的无效行为都会转换成你的收益,因此隐藏你的企图是很有用的,对手越是怀疑,策略越是没效; 而在非零和博弈(如“重复囚徒困境”)中,你需要从对方的合作中得到好处,就必须鼓励合作,而对手越是清楚你愿意合作,合作就越容易促成。 “一报还一报”在竞赛中得到巨大成功的原因之一,就是它具有很大的清晰性,非常容易被对方理解。 

五、最后的总结 

从前文可以得出这样的结论: 在“重复囚徒困境”,也即非零和博弈中,合作是过更好的选择。 作者在书中举了一个现实的例子: 在第一次世界大战堑壕战中,敌对的士兵经常表现出很大的克制,双方似乎都默契地执行着“自己活也让别人活”的策略。 这种现象是堑壕战的特产。因为在堑壕战中,敌对双方都需要长时间对峙,符合“重复囚徒困境”的条件。 而在其他类型战争,如突袭战、闪电战,则并不会出现类似的情况。 为了更好地促进合作,罗伯特·阿克塞尔罗德也提出了几个建议: 

1、增大未来的影响。 

如果未来相对于现在是足够重要的,或者双方有更高的频率在未来相遇的话,人们在做决策时就会更加考虑对未来的影响,从而更能促进合作。 

2、改变收益值。 

比如增大对背叛的惩罚,当背叛的惩罚大到不管对方如何选择,从短期来看合作都是最好的策略时,就不会再有困境了。 

3、教育人们相互关心和回报。 

促进合作的极好的方法依然是从教育入手,在孩童时代就教育人们要关心他人的利益、懂得回报,形成价值观。 

读到这里,合作或者背叛应该怎么选,朋友们清楚了吗?

阅读更多科学技术精彩内容,可前往什么值得买查看

","gnid":"958ff282bdec1fe54","img_data":[{"flag":2,"img":[{"desc":"","height":"412","title":"","url":"https://p0.ssl.img.360kuai.com/t019ffafa39417c08d8.jpg","width":"550"}]}],"original":0,"pat":"art_src_1,otherc,fts0,sts0","powerby":"pika","pub_time":1704361761000,"pure":"","rawurl":"http://zm.news.so.com/26838f24a232f60697452d36252d9608","redirect":0,"rptid":"c1ce7ad34f515dda","rss_ext":[],"s":"t","src":"什么值得买","tag":[{"clk":"kgame_1:零和博弈","k":"零和博弈","u":""}],"title":"合作 or 背叛:博弈论里的囚徒困境怎么解决?

麻妮颖4184博弈论为什么有这么大影响?博弈论为什么有这么大影响力
嵇真绍13852486515 ______ 1.博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应...

麻妮颖4184利他主义的表现形式有哪些?
嵇真绍13852486515 ______ 利他主义有三种典型的表现形式:第一、“亲缘利他”即有血缘关系的生物个体为自... 模型直到20世纪晚期才由博弈论专家阿克塞罗德建立起来,(Xelrod,1984)但它的基...

麻妮颖4184有关心理学的著作
嵇真绍13852486515 ______ 《生活心理学》《心理学与生活》《社会心理学》《日常生活的心理分析》 《心理学的诡计:日常生活的心理学博弈》《改变生活的66个心理学经典故事》 《生活中的心理学知识大全》《改变生活的心理学法则》《心理学改变生活》 好了!!:)

麻妮颖4184请问什么是博弈论?这一理论在解决国际冲突方面有什么具体作用?
嵇真绍13852486515 ______ 博弈论(Game Theory),有时也称为对策论,或者赛局理论,数学的一个应用分支, 目前在生物学,经济学,计算机科学和其他很多学科都有广泛的应用.是研究具有斗...

麻妮颖4184运筹学的应用部门我的孩子读的是数学类运筹学,即将毕业,想了解一下
嵇真绍13852486515 ______ 运筹学的特点是: 1.运筹学已被广泛应用于工商企业、军事部门、民政事业等研究... 对策论 对策论也叫博弈论,前面讲的田忌赛马就是典型的博弈论问题.作为运筹学的...

麻妮颖4184请教各位高手,发生某种事件的概率是不是一成不变的呢?如果不是,有?
嵇真绍13852486515 ______ 我说的不一定对,大家探讨,集思广益. 如果不考虑个例情况,我觉得受两个因素影响最大,一是整体经济环境变化(比如发生金融危机),二是受社会道德环境影响(假设经济状况相同,汕头人和西安人的还款状况肯定比较悬殊)

麻妮颖4184澳大利亚为什么又叫澳洲?
嵇真绍13852486515 ______ 澳大利亚就是澳大利亚,她是澳洲最大的国家.澳洲也叫大洋洲,包括澳大利亚、新西兰 帕劳 斐济 基里巴斯 马绍尔群岛 汤加 萨摩亚 瑙鲁 所罗门 群岛 瓦努阿图 图瓦卢 巴布亚新几内亚 密克罗尼西亚 库克群岛 等 如果说澳洲大陆,一般就是指澳大利亚,但是“澳洲”本身就是大洋洲的概念了

麻妮颖4184退学的大学生怎么把户口从学校打回原籍后再迁回家????
嵇真绍13852486515 ______ 先到学校办理户口转出证明,然后拿退学文件一起到户口所在地的派出所办理户口转出证明(要记得家里派出所的名字),再重新回到家里的派出所办理重新落户手续.

麻妮颖4184八仙花有什么特点?
嵇真绍13852486515 ______ 八仙花,又名绣球、斗球、草绣球、紫绣球、紫阳花等,属 虎耳草科,落叶灌木.八仙花的叶大而对生,浅绿色有光泽,呈椭圆形或倒卵形,边缘具钝锯齿.八仙花花球硕...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024