求一篇运筹学小论文,期末要交,急.
来源:学生作业帮助网 编辑:六六作业网 时间:2024/11/28 15:29:26
求一篇运筹学小论文,期末要交,急.
求一篇运筹学小论文,期末要交,急.
求一篇运筹学小论文,期末要交,急.
博弈之囚徒困境
论打破囚徒僵局,走出囚徒困境
(一)囚徒困境理论
在学习和生活中,我们会遇到诸多面临决策,进退两难的问题,那么如何决策呢?不同的策略带来不同的损益,有时当博弈双方都以自己的最大利益为策略博弈时,结果相反,时双方都陷入自己所要逃避的困境,这便是囚徒困境!
囚徒困境经典案例①:
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪.于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年.
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年.
甲乙 背板(指证乙犯罪) 默认
背叛(指证甲犯罪) (-5,-5) (0,-10)
默认 (-10,0) (-1,-1)
数字代表双方在不同情况下服刑年限
若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年.
嫌疑人甲、乙双方均不知对方的策略,且都是自私利己之人.
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口.就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低.
试设想困境中两名理性囚徒会如何作出选择:
若对方沉默、背叛会让我获释,所以会选择背叛.
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛.
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛.
背叛是两种策略之中的支配性策略.因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑5年.
(二)生活中的囚徒困境
博弈在现实生活中不出不在.博弈双方大到国际贸易国与国之间的竞争,小到个人与个人之间的经济交易;动物之间同样也存在博弈,甚至植物在阳关下吸收养分也存在博弈.有竞争就有博弈,有交易就有博弈,博弈渗透到生活中的每个角落.
参与博弈的双方或多方如何采取策略,保障自己最大的利益和最小的损失;往往利益最大的也是风险最大的,一旦失败,损失也是最大的,如何决策,这便使得博弈人陷入“囚徒困境”.
博弈的囚徒困境覆盖面极广,涉及军事决策,政治手段,企业经营,市场策略,生活理财等诸多方面.
企业在市场经营决策中,和竞争对手既是博弈的双方,也是囚徒双方,利益最大的选择是双方共有的,同时也是损失最大的,如何决策,使自己受益最大,合作求双赢,殊死博弈,两败俱伤,一场空.
在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优.简单地说,“囚徒的困境”问题都是个体理性和集体理性的矛盾引起的;这便是囚徒困境的内在根源.
(三)囚徒困境现实意义及启示
“囚徒的两难选择”有着广泛而深刻的意义.个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局.他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期.只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果.
“纳什均衡”对亚当·斯密的“看不见的手”的原理提出挑战.按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果.《国富论》中有这样一句名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益”.从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他.两个囚徒的命运就是如此.
从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石.因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”.但它必须符合以下黄金定律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行.也就是中国人说的“己所不欲勿施于人”.但前提是人所不欲勿施于我.
囚徒困境的现实意义就是个人理性导致集体非理性.
在囚徒博弈的模型中,只存在一个纳什均衡,即:在参与者理性的情况下,坦白为最优策略.这同时导致了集体利益的最小化.
事实上,在囚徒困境中的最佳策略取决于对方采用的策略,特别是取决于这个策略为双方合作留出多大的余地.而这个原则的基础是:以后对于现在的权重足够大,即:未来是重要的.
如果未来是重要的,那么就要选择合作,而合作的策略取决于对方的策略.于是结论是:没有最优策略!
那么,如何使得博弈双方走出“囚徒的困境”呢?
(四)打破囚徒僵局,走出囚徒困境②
要破解囚徒困境,就要跳出囚徒困境模型本身,打破囚徒困境博弈的死局,从更高的层面上给以制度性的约束,或让大家都明白合作的好处.
如何走出囚徒困境?
1.报复与惩罚(株连制):
假如每一个拒供的囚徒都可以在刑满释放后对供认的囚徒实施报复,那么每个囚徒就可能因担心未来的报复而在现实选择拒供,使得出现(默认,默认)的均衡结果.合作就自然达成了.现实中,的确有很多犯罪团伙的成员,被捕后拒不坦白,很大程度上与一个由第三方实施的惩罚机制有关.因为在犯罪团伙中,如果出卖“兄弟”,将永远无法在“江湖”立足,并且其家人也将受到黑社会的追杀.正是这样的第三方惩罚机制,使得报复和惩罚是可信的,从而促成了囚徒的合作.
2. “人质”方案:
在囚徒困境中,两个囚徒当然也清楚自利行为的后果是集体失利,每个人的状况都将更糟糕.因此,如果每个人都相信对方不会招供,那么合作拒供的结果也将可以出现.也就是说,如果可以克服信任问题,那么合作达成也是可能的.顺理成章,促进信任的“人质”方案,常常也会促进合作,走出囚徒困境.
3.长期关系和重复博弈:
建立长期关系,使得囚徒困境可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前,合作也是可以达成的.
参考文献:
①1950年,由就职于兰德公司的梅里尔·弗勒德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问艾伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”.
②打破“囚徒格局”参考:郑也夫·《走出囚徒困境》·“寻找均衡”与“和平之门”.
我就会这么多了~!