关于博弈论的问题,帮解答下啊模型化下述划拳博弈:两个老朋友在一起喝酒,每个人有4个纯战略:杠子,老虎,鸡和虫子.输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两个同时出令,如果一个打败另
来源:学生作业帮助网 编辑:六六作业网 时间:2024/12/25 22:42:19
关于博弈论的问题,帮解答下啊模型化下述划拳博弈:两个老朋友在一起喝酒,每个人有4个纯战略:杠子,老虎,鸡和虫子.输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两个同时出令,如果一个打败另
关于博弈论的问题,帮解答下啊
模型化下述划拳博弈:
两个老朋友在一起喝酒,每个人有4个纯战略:杠子,老虎,鸡和虫子.输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两个同时出令,如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡.写出过程啊,谢谢啊
关于博弈论的问题,帮解答下啊模型化下述划拳博弈:两个老朋友在一起喝酒,每个人有4个纯战略:杠子,老虎,鸡和虫子.输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两个同时出令,如果一个打败另
A
杠子 虎 鸡 虫子
杠子 0,0 1,-1 0,0 -1,0
B 虎 -1,1 0,0 1,-1 0,0
鸡 0,0 -1,1 0,0 1,-1
虫子 1,-1 0,0 -1,1 0,0
没有纯均衡,混合战略纳什均衡:两者都是:杠子 虎 鸡 虫子各保持0.25
因为事物皆有两面性,很多情况下一个社会问题是正确还是错误并不是绝对的。相对而言更符合社会发展潮流的是正确的,违背则是错误的。而博弈论:在整个社会
棒子 ---A
虎 ---B
鸡 --- C
虫子 ---D
A B C D
A 0,0 1,-1 0,0 -1,1
B -1,1 ...
全部展开
棒子 ---A
虎 ---B
鸡 --- C
虫子 ---D
A B C D
A 0,0 1,-1 0,0 -1,1
B -1,1 0,0 1,-1 0,0
C 0,0 -1,1 0,0 1,-1
D 1,-1 0,0 -1,1 0,0
Let two peoples' strategy functions be f(.) and g(.)
Mixed Nash equilibrium makes each other indifferent
=>
f(a)g(a)u1(a,a)+f(a)g(b)u1(a,b)+f(a)g(c)u1(a,c)+f(a)g(d)u1(a,d)
=
f(b)g(a)u1(b,a)+f(b)g(b)u1(b,b)+f(b)g(c)u1(b,c)+f(b)g(d)u1(b,d)
=
f(c)g(a)u1(c,a)+f(c)g(b)u1(c,b)+f(c)g(c)u1(c,c)+f(c)g(d)u1(c,d)
=
f(d)g(a)u1(d,a)+f(d)g(b)u1(d,b)+f(d)g(c)u1(d,c)+f(d)g(d)u1(d,d)
==>
f(a)g(b)-f(a)g(d)=f(b)g(c)-f(b)g(a)=f(c)g(d)-f(c)g(b)=f(d)g(a)-f(d)g(c)
AND f(a)+f(b)+f(c)+f(d)=g(a)+g(b)+g(c)+g(d)=1
Since the game is symmetric, so strategies are identical, so
ab-ad = bc - ba = cd-cb = da-dc
=>
f(a)=f(b)=f(c)=f(d)=0.25
Mixed NE:
(0.25A+0.25B+0.25C+0.25D,0.25A+0.25B+0.25C+0.25D)
收起
案例-囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被...
全部展开
案例-囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner's dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈 [Prisoner's dilemma] A╲B 坦白 抵赖
坦白 -8,-8 0,-10
抵赖 -10,0 -1,-1
对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。你参照这个做吧
收起