博弈论最经典的话

首页 >> 正文

博弈论最经典的话

来源：baiyundou.net 日期：2024-08-27

作者：布欧buooou

文章字数：3000

阅读时间：5分钟

《合作的进化》是罗伯特·阿克塞尔罗德的一本博弈论经典之作，作者以“重复囚徒困境”游戏作为切入点，讲述了在与他者的持续交往中，应该选择怎样的合作策略才能得到较好的收益。本书的一个重要结论是，人们相互作用越频繁，合作的可能性就越大。本篇文章，是对《合作的进化》核心内容的总结。

一、前言

先从两个简单的问题开始：

1、在与他人的持续交往中，人什么时候应该合作，什么时候只需为自己着想？

2、一个人会继续帮助他的一位从来不思回报的朋友吗？

合作，是我们常常要面对的事，小到个人，大到国家。合作虽然能带来好处，但并不总是能建立起来。两国之间的贸易壁垒就是一个很好的例子。显然，自由贸易对两国都能带来好处，但问题是，无论谁单方面取消壁垒，都会导致自己国家处于不利的贸易状态。所以，无论一个国家如何做，另一个国家保持它的贸易壁垒总是比较有利的。因此，每个国家都有利益动机保持贸易壁垒。同理，在人与人之间、公司之间的也会存在类似的场景，我们可以用一个简单的游戏来进行模拟，那就是著名的“囚徒困境”游戏。

二、囚徒困境

在“囚徒困境”游戏中，有两个对策者，每人都有两个选择：合作或背叛，并且都需要在不知道对方选择的情况下做出自己的选择。每种选择对应的收益如下图所示：

从图中可以看出，当双方都选择合作时，集体收益是最高的6；

当一人选择合作，另一人选择背叛时，背叛一方的个人收益是最高的 5。

之所以称为“困境”，是因为不管对方怎么选择，从个人的角度，背叛都是更好的选择，而双方背叛却会导致最低的集体收益。

从上述结论来看，背叛是必然的选择，那么为什么现实世界中，还会存在这么多的合作呢？其实，上述结论的前提是，对策者双方只相遇一次，在只考虑当前回合的最大收益情况下，背叛是必然的。但是，如果双方会在将来相遇多次，那么就要考虑后续的收益，情况将变得复杂，我们将这称为“重复囚徒困境”。为了探讨“重复囚徒困境”下的最优策略，作者组织了重复囚徒困境游戏的计算机竞赛，并邀请众多博弈论专家参与。

三、“一报还一报”

在计算机竞赛中，参加者提交一个能给出每一回合策略（合作或者背叛）的程序，该程序在作策略选择时可以利用对局的历史。竞赛是循环的，即每个程序都会与其他程序相遇，每轮比赛有 200 次对局，以此来模拟出“重复”。竞赛的结果有点出乎意料，胜者是“一报还一报”策略，它是所有提交程序中最简单的策略，结果却是最好的。 “一报还一报”的策略是，最开始选择合作，随后按对方上一回合的选择去做，如果对方出现背叛，那么“一报还一报”也会在下一回合背叛来进行“报复”，但只会报复一个回合。下图举例了“一报还一报”与其他策略的6个回合的对局情况：

从上述例子来看，“一报还一报”策略在每一个对局之中都不是得分领先的一方，甚至在遇到全背叛策略A时6个回合的得分仅仅3分。

但是，在单回合不占优的情况下，“一报还一报”依然在竞赛中却能获得胜利。值得注意的是，在所有竞赛参与者中，善良策略（不首先背叛）的平均得分要比非善良策略（首先背叛）的平均得分高 25%！前 8 名的策略都是善良的。而在善良策略中，得分最低的是最少宽容性的规则，一个采用永久报复的完全不宽容的规则。“一报还一报”策略成功的原因，是它综合了善良性、报复性、宽容性和清晰性： 善良性防止它陷入不必要的麻烦； 报复性使对方试着背叛一次后就不敢再背叛； 宽容性有助于重新恢复合作； 清晰性使它容易被对方理解，从而引出长期的合作。

四、合作 or 背叛，你怎么选？

那么，在人与人相处的时候，我们应该怎么做呢？作者给出了 4 点建议:

1、不要嫉妒

2、不要首先背叛

3、对合作与背叛都要以回报

4、不要耍小聪明

1、不要嫉妒

人们总是习惯考虑零和博弈，这种情况下，一个人赢，另一个就输，比如下棋。但在现实生活中，大多数情况属于非零和博弈，也即可以双赢，也能双输。这种情况下，合作是可能的，但并不总能实现。人们倾向于采用相对的标准，经常把对方的成功与自己的成功联系起来，从而导致了嫉妒。当嫉妒出现时，人会企图抵消对方已经得到的优势，通常通过背叛来实现。但背叛往往会导致更多的背叛，进而是双输的局面。因此，嫉妒无疑是自我毁灭。 要求自己比对方做得好，不是一个很好的标准，除非你的目的是消灭对方。 更好的做法是，把你所做的，与处在相同情况下的其他人所做的，进行比较。对于相同的策略，你是否已经做得最好了？其他人在这种情况下能做得更好吗？因此，只要你自己能做得更好，就让对方做得和你一样或略好些，就像“一报还一报”在每个对局中并不是优胜的一方，但并不妨碍它能赢得竞赛的胜利。我们没有理由去嫉妒他人的成功，因为在长时间的“重复囚徒困境”中，他人的成功是你自己成功的前提！

2、不要首先背叛

竞赛和理论分析的结果都表明，在非零和博弈中，善良策略是表现更好的一方，善良性能够避免不必要的冲。非善良策略在开头还显得挺有希望，但是时间一长它就摧毁了它自己赖以成功的基础。

3、对合作与背叛都要给予回报

竞赛中，“一报还一报”的成功给我们一个简单且有力的建议：要回报。 对善良者报以合作，对非善良者报以背叛。 值得注意的是，在报以背叛时，我们要保持惩罚与宽恕的平衡。“一报还一报”总是在对方每次背叛之后只背叛一次，而不是永久背叛，因此它成功了。但并不是说只背叛一次就是最优的，最优的宽恕水平与环境有关，如果周边绝大多数都是非善良的策略，那么，太多的宽恕反而会付出更多的代价。

4、不要耍小聪明

在“囚徒困境”的情形中，人们容易耍小聪明，然而复杂的规则并不比简单的规则做得更好，赢得竞赛的反而是最简单、最易理解的“一报还一报”策略。原因主要在于，在零和博弈中（如下棋），对手任何的无效行为都会转换成你的收益，因此隐藏你的企图是很有用的，对手越是怀疑，策略越是没效；而在非零和博弈（如“重复囚徒困境”）中，你需要从对方的合作中得到好处，就必须鼓励合作，而对手越是清楚你愿意合作，合作就越容易促成。 “一报还一报”在竞赛中得到巨大成功的原因之一，就是它具有很大的清晰性，非常容易被对方理解。

五、最后的总结

从前文可以得出这样的结论：在“重复囚徒困境”，也即非零和博弈中，合作是过更好的选择。作者在书中举了一个现实的例子： 在第一次世界大战堑壕战中，敌对的士兵经常表现出很大的克制，双方似乎都默契地执行着“自己活也让别人活”的策略。 这种现象是堑壕战的特产。因为在堑壕战中，敌对双方都需要长时间对峙，符合“重复囚徒困境”的条件。 而在其他类型战争，如突袭战、闪电战，则并不会出现类似的情况。 为了更好地促进合作，罗伯特·阿克塞尔罗德也提出了几个建议：

1、增大未来的影响。

如果未来相对于现在是足够重要的，或者双方有更高的频率在未来相遇的话，人们在做决策时就会更加考虑对未来的影响，从而更能促进合作。

2、改变收益值。

比如增大对背叛的惩罚，当背叛的惩罚大到不管对方如何选择，从短期来看合作都是最好的策略时，就不会再有困境了。

3、教育人们相互关心和回报。

促进合作的极好的方法依然是从教育入手，在孩童时代就教育人们要关心他人的利益、懂得回报，形成价值观。

读到这里，合作或者背叛应该怎么选，朋友们清楚了吗？

阅读更多科学技术精彩内容，可前往什么值得买查看

","gnid":"958ff282bdec1fe54","img_data":[{"flag":2,"img":[{"desc":"","height":"412","title":"","url":"https://p0.ssl.img.360kuai.com/t019ffafa39417c08d8.jpg","width":"550"}]}],"original":0,"pat":"art_src_1,otherc,fts0,sts0","powerby":"cache","pub_time":1704361761000,"pure":"","rawurl":"http://zm.news.so.com/26838f24a232f60697452d36252d9608","redirect":0,"rptid":"c1ce7ad34f515dda","rss_ext":[],"s":"t","src":"什么值得买","tag":[{"clk":"kgame_1:零和博弈","k":"零和博弈","u":""}],"title":"合作 or 背叛：博弈论里的囚徒困境怎么解决？

宰李国1600甲乙两个公司谈判,分6次,双方可以出红牌或黑牌,双方都是红牌,则都有30万,双方都是黑牌,则都亏2 -
穆萧萧13094806531 ______ 这题应该不是问怎么做吧,而是问最后会是什么结果. 在两个公司之间不能协商的情况下,其中的每一个都会每次都出黑牌,思考过程如下(以甲公司)为例: 如果乙公司出红牌,甲公司出黑牌则得到50万,出红牌则得到30万,出黑牌多赚20万. 如果乙公司出黑牌,甲公司出黑牌则损失20万,出红牌则损失50万,出黑牌少亏30万. 可以看出,无论乙公司如何抉择,甲公司出黑牌总是对他自己最优的选择. 乙公司也是同样的想法,因此也会每次出黑牌.结果就是两家公司各亏损120万.而他们本可以各赚180万的(如果可以协商的话). 这个是博弈论的经典例子“囚徒困境”的一种变形,用于说明对个体最优的抉择很可能对整体是双输的结局.

宰李国1600求:博弈变通的素材 -
穆萧萧13094806531 ______ “博弈论”原本是数学的一个分支,但由于它较好地解决了对竞争等问题的可操作性分析,成为经济学中激荡人心的一个研究领域.可以说,“博弈论”已经改变了经济学的传统轮廓线.从对“博弈论”简要、通俗的介绍中可以发现,我们身边...

宰李国1600你愿意作出自己最后的努力呢,还是弃之而去?
穆萧萧13094806531 ______ 对于这个问题的选择,我认为与个人的需求有关系,问题的关键在于你想得到什么.... 而是已经根本无药可救,我想要选择的话就很简单,也不会那么痛苦. 相反,虽然企...

宰李国1600表中的数字分别表示a,b被判刑年数请问两囚徒作何选择为上策 -
穆萧萧13094806531 ______ “囚徒困境”是博弈论里最经典的例子之一.它的模型是这样的:两个嫌疑犯(A和B)作案后被抓住,隔离审讯;的政策是＂坦白从宽,抗拒从严＂,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;...

宰李国1600请帮忙找一下有关博弈论的寓言或者小故事. -
穆萧萧13094806531 ______ 博弈论又被称为对策论(Games Theory),是研究具有斗争或竞争性质现象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学科.精彩的博弈论小故事:目标一条猎狗将兔子赶出了窝,一直追赶它,追了很久仍没有捉到...

宰李国1600如果我和你犯罪被捕了,且如果两人抵赖则判2年,一人抵赖一人坦白,抵赖判8年坦白释放,2人坦白都判10年,那么你打算怎样?我十分想知道你的答案! 选择抵赖或坦白! -
穆萧萧13094806531 ______ 这确实是楼上说的“囚徒悖论”,但是由于信息的不对称,根据博弈论原理以及数学期望,最有可能选择的是坦白,这便造成了两人获刑最严重的情况,但是如果你为对方考虑的话就会选择坦白,也就可以走出这个困境!

宰李国1600什么是 prisoner's dilemma -
穆萧萧13094806531 ______ 囚徒的困境

宰李国1600博弈论模型 -
穆萧萧13094806531 ______ 囚徒困境目录经典的囚徒困境一般形式现实的例子与囚徒困境相关的各事件重复的囚徒困境相关的博弈注释囚徒困境(Prison Dilemma)是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择.虽然困境本身只属...

宰李国1600什么是博弈?什么是囚徒困境?它在垄断竞争中有何作用? -
穆萧萧13094806531 ______ 一楼纯粹是胡说八道! 1、关于博弈的定义: 简单点说,就是人与人之间为了谋取利益而竞争.用比较书面话的语言来表述:博弈是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依靠所掌握的信息,选择各自策略(行...

宰李国1600哪些有关博弈论的书写得好点?要论述比较金典的
穆萧萧13094806531 ______ 博弈论(战略分析入门)/经济教材译丛.机械工业出版社.42.00博弈论的诡计(日常生活中的博弈策略插图本)/Wisdom书系.中国发展出版社.29.00,超经典的

（编辑：自媒体）