wh 博弈题及参考答案

来源：网络收集时间：1970-01-01 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

复习题与参考答案

1、设定一个静态博弈模型必须确定哪几个方面？设定一个动态博弈模型必须确定哪几个方面？

参考解答：设定一个静态博弈模型必须确定的方面包括：（1）博弈方，即博弈中进行决策并承担结果的参与者；（2）策略（空间），即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等；（3）得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量。

设定一个动态博弈模型必须确定的方面包括：（1）博弈方，即博弈中进行决策并承担结果的参与者与虚拟博弈方；（2）策略（空间），即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等；（3）得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量；（4）博弈次序，即博弈方行为、选择的先后次序或者重复次数等；（5）信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度；

无论静态还是动态博弈模型，博弈方的行为逻辑和理性程度，即博弈方是依据个体理性还是集体理性行为，以及理性的程度等。

2、博弈有那些分类方法，有那些主要类型？参考解答：

首先可根据博弈方的行为逻辑，是否允许存在有约束力协议，分为非合作博弈和合作博弈两大类。

其次可以根据博弈方的理性层次，分为完全理性博弈和有限理性博弈两大类，有限理性博弈就是进化博弈。

第三是可以根据博弈过程博弈方行为是否同时分为静态博弈、动态博弈和重复博弈三大类。

第四是根据博弈问题的信息结构，根据博弈方是否都有关于得益和博弈过程的充分信息，分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。

第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。

第六是根据博弈中博弈方的数量，可将博弈分为单人博弈、两人博弈和多人博弈。

第七是根据博弈方策略的数量，分为有限博弈和无限博弈两类。 3、博弈与游戏有什么关系？参考答案：

现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择，特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生活中的下棋打牌、赌胜博彩，以及田径、球类等各种体育比赛。因此博弈和游戏之间当然是有明显区别的。但博弈和游戏之间其实也有重要的联系，因为博弈与许多游戏之间在本质特征方面有相同的特征：（1）都有一定的规

则；（2）都有能用正或负的数值表示，或能按照一定的规则折算成数值的结果；（3）策略至关重要；（4）策略和利益又相互依存性。正是因为存在这些共同的本质特征，因此从研究游戏规律得出的结论可用来指导经济政治等活动中的决策问题，或者把这些决策问题当作游戏问题研究。因此博弈在一定程度上可以理解成就是游戏。其实“博弈”的英文名称“Game”的基本意义就是游戏。 4、判断下列叙述是否正确，并作简单分析。

a) 囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，

是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。

b) 合作博弈就是博弈方采取互相合作态度的博弈。参考答案：

a) 错误。结论恰恰相反，也就是囚徒的困境博弈中两囚徒之所以处于困境，

根源正是因为两囚徒很在乎坐牢的绝对时间长短。此外，我们已开始就假设两囚徒都是理性经济人，而理性经济人都是以自身的（绝对）利益，而不是相对利益为决策目标。

b) 不正确。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束

力协议限制行为选择的博弈问题，与博弈方的态度是否合作无关。 5、“囚徒的困境”的内在根源是什么？举出现实中的“囚徒的困境”的例子。有没有让囚徒走出困境的可能。

参考解答：“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整个、个体利益共同的最优。简单地说，“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。

现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争，初中、中等教育中的应试教育等，其实都是“囚徒的困境”博弈的表现形式。举一个自己熟悉的囚徒困境博弈的模型。

6、判断下列表述是否正确，并作简单分析：

a) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。 b) 如果以博弈有两个纯策略纳什均衡，则一定还存在一个混合策略均衡。 c) 上策均衡一定是帕累托最优的均衡吗？并说明哪一个均衡更稳定些。参考答案：

a) 错误。只要任一博弈方单独改变策略不会增加得益，策略组合就是纳什

均衡了。单独改变策略只能得到更小得益的策略组合是严格纳什均衡，

是比纳什均衡更强的均衡概念。

b) 正确。这是纳什均衡的基本性质之一——奇数性所保证的。

c) 不正确。囚徒的困境博弈中的（坦白，坦白）就是上策均衡（同时也是

纳什均衡），但该均衡显然不是帕累托最优的，否则就不会称其为囚徒的困境了。

7、下面的得益矩阵两博弈方之间的一个静态博弈，该博弈有没有纯策略的纳什均衡，博弈的结果是什么？

博弈方2

L C R 博 T 2，0 1，1 4，2 弈 M 3，4 1，2 2，3 方 B 1，3 0，2 3，0 1

参考解答：首先，运用严格下策反复消去法的思想，不难发现在博弈方1的策略中，B是相对于T的严格下策，因此可以把该策略从博弈方1的策略空间中消去。把博弈方1的B策略消去后又可以发现，博弈方2的策略中C是相对于R的严格下策，从而也可以消去。在下面的得益矩阵中相应策略和得益处划水平线和垂直线表示消去了这些策略。

博弈方2

L C R 博 T 2，0 1，1 4，2 弈 M 3，4 1，2 2，3 方 B 1，3 0，2 3，0 1

两个博弈方各消去一个策略后的博弈是如下的两人2×2博弈，已经不存在任何严格下策。再运用划线或箭头法，很容易发现这个2×2博弈有两个纯策略纳什均衡（M，L）和（T，R）。

博弈方2

L R 博 T 2，0 4，2 弈 M 3，4 2，3 方 1

由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系，双方利益有不一致性，因此如果没有其他进一步的信息或者决策机制，一次性静态博弈的结果不能肯定。由于双方在该博弈中可能采取混合策略，因此实际上该博弈的结果可以是4个纯策略组合中的任何一个。

8、下面的得益矩阵表示一个两人静态博弈。问当a、b、c、d、e、f、g和h满足什么条件时，该博弈：

a) 存在严格上策均衡；

b) 可以用严格下策反复消去法简化或找出博弈的均衡； c) 存在纯策略纳什均衡。

博弈方2 L 博弈方1

U D

a，b e，f R c，d g，h 参考答案：

a) 严格上策均衡是由各个博弈方的严格上策组成的策略组合。对于博弈方1，

如果a>e且c>g，则U是相对于D的严格上策；如果ad且f>h，则L是相对于R的严格上策；如果b

b) 只要出现a>e且c>g、ah或b

何一种，就可以用严格下策反复消去法简化或直接求出博弈的均衡，因为这个时候D、U、R、L分别是相应博弈方相对于各自另一策略的严格下策。 c) 纯策略纳什均衡是个博弈方单独改变策略都无利可图的策略组合。在上述博

弈中，只要满足a≥e且b≥d、c≥g且d≥b、e≥a且f≥h，g≥c且h≥f四种情况中的任何一种，就存在纯策略纳什均衡。

9、你正在考虑是否投资100万元开设一家饭店。假定情况是这样的：

当你决定开，则35%的可能将收益300万（包括投资），65%的可能将全部亏损；

当你决定不开，则你能保住本钱但没有利润。试考虑

（a）用得益矩阵和扩展形表示该博弈；（b）如果你是风险中性的你会怎么选择？

（c）如果成功的可能降低到30%，你会怎么选择？

（d）如果你是风险规避的，且期望得益的折扣系数为0.9，你的选择是什么？（e）如果我是风险偏好的，期望得益的折算系数为1.2，你的选择又是什么？参考解答：

（a）根据问题的假设，该博弈的得益矩阵和扩展形表示分别如下：

自然

赚（35%）亏（65%）

开我 300 0 不开 100 100

赚（35%）自然亏（65%）（b）如果我是风险中性的，那么根据开的期望收益与不开收益的比较：我不开 300+0.65×0=105＞100 0.35×开开不开肯定会选择开。

（300）（100） 0.3 （0）（100）（c）如果成功的概率降低到，那么因为这时候开的期望收益与不开的收益比较：

0.30×300+0.70×0=90＜100 因此会选择不开，策略肯定会变化。（d）如果我是风险规避的，开的期望收益为：

0.9×（0.35×300+0.65×0）=0.9×105=94.5＜100 因此也会选择开。

（e）如果我是风险偏好的，那么因为开的期望收益为：

1.2×（0.35×300+0.65×0）=1.2×105=126＞100 因此这时候肯定会选择开。

10、如果双寡头垄断的市场需求函数是p(Q)=a-Q，两个厂商都无固定生产成本，边际成本为相同的c。如果两个厂商都只能要么生产垄断产量的一半，要么生产古诺产量，证明这是一个囚徒困境型的博弈。

参考答案：

根据市场需求函数p(Q)=a-Q和厂商的生产成本，不难计算出该市场的垄断产量为qm=(a-c)/2，双寡头垄断的古诺产量（纳什均衡产量）为qc=(a-c)/3。两个厂商都生产垄断产量的一半(a-c)/4时，各自的利润为

a?c??a?c(a?c)a??c????248??两个厂商都产生古诺产量(a-c)/3时，各自的利润为：

2(a?c)?a?c(a?c)?a??c????339??若一个厂商产生垄断产量的一半(a-c)/4，，另一方生产古诺产量(a-c)/3，前者利润为：

a?ca?c??a?c5(a?c) ??c????a?34448??后者利润为：

2222a?ca?c??a?c5(a?c) ??c????a?34336??

因此上述博弈用下列得益矩阵表示就是：

企业甲

qm/2

企业乙

qm/2 (a-c)2/8，(a-c)2/8 qc 5(a-c)2/48，5(a-c)2/36 qc 5(a-c)2/36，5(a-c)2/48 (a-c)2/9，(a-c)2/9 分析这个得益矩阵可以看出，因为(a-c)2/8<5(a-c)2/36，5(a-c)2/48<(a-c)2/9，因此qm/2对两个厂商都是相对于qc的严格下策。所以该博弈唯一的纳什均衡，也是上策均衡，是(qc,qc)。这个纳什均衡的双方得益(a-c)2/9，显然不如双方都采用qm/2的得益(a-c)2/8，因此这个博弈是一个囚徒困境型的博弈。 11、博弈方1和博弈方2就如何分10000元进行讨价还价，假定确定了以下规则：双方同时提出自己要求的份额S1 和S2 ,0≤S1,S2≤10000，如果S1+ S2≤10000 ,则两博弈方的要求都得到满足，即分别得S1 和S2 ,但如果S1+ S2＞10000，则该博弈的纯策略纳什均衡是什么？如果你是其中一个博弈方，你会要求什么份额，为什么？参考解答：

用反应函数法分析博弈。先讨论博弈方1的选择。根据问题的假设，如果博弈方2选择金额S2（0≤S2≤10000），则博弈方1选择S1的利益为：

?s1当S1≤10000 -S2 U(S1)=? 当S1≤10000 -S2 ?0因此博弈方1采用S1=1000—S2时，能实现自己的最大利益U(S1)= S1=1000

—S2。因此S1=1000—S2就是博弈方1的反应函数。

博弈方2与博弈方1的利益函数和策略选择是完全相似的，因此对博弈方1所选择的任意金额s1，博弈方2的最优反应策略，也就是反应函数是S2=1000- S1。

显然，上述博弈方1的反应函数与博弈方2的反应函数是完全重合的，因此本博弈有无穷多个纳什均衡，所有满足该反应函数，也就是S1+ S2=10000的数组（S1 ，S2）都是本博弈的纯策略纳什均衡。

如果我是两个博弈方中的一个，那么我会要求得到5000元。理由是在该博弈的无穷多个纯策略纳什均衡中，（5000，5000）既是比较公平和容易被双方接受的，也是容易被双方同时想到的一个，因此是一个聚点均衡。

12、在纳什均衡分析的基础上，再进一步考虑运用其他均衡概念或分析方法，如风险上策均衡等进行分析。

博弈方2 L R 博弈方1 参考答案：

U D

6，6 7，2 2，7 0，0 首先，很容易根据划线法等找出本博弈的两个纯策略纳什均衡（U，R）和（D，L）。本博奕还有一个混合策略纳什均衡，即两博弈方各自以2/3、1/3的概率在自己的两个策略U、D和L、R中随机选择。

但本博弈的两个纯策略纳什均衡中没有帕累托上策均衡，两个博弈方各偏好其中一个，而且另一个策略组合（U，L）从整体利益角度优于这两个纯策略纳什均衡，因此博弈方很难在两个纯策略纳什均衡的选择上达成共识。混合策略纳什均衡的效率也不是很高，因为有一定概率会出现（D，R）的结果。

根据风险上策均衡的思想进行分析，当两个博弈方各自的两种策略都有一半可能性被选到时，本博弈的两个纯略纳什均衡都不是风险上策均衡，而策略组合（U，L）却是风险上策均衡。因为此时博弈方1选择U的期望得益是4，选择D的期望是益是3.5，博奕方2选择L的期望得益是4，选择R的期望得益是3.5。因此当两个博弈方考虑到上述风险因素时，他们的选择将是（U，L），结果反而比较理想。

如果博弈问题的基本背景支持，对本博弈还可以用相关均衡的思想进行分析。同学们可自己作一些讨论。

13、子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合；它们不仅在整个博弈中构成纳什均衡，而且在所有的子博弈中也都构成纳什均衡。

参考解答：

在动态博弈分析中引进子博弈完美纳什均衡概念的原因在于，动态博弈中各个博弈方的行为有先后次序，因此往往会存在相机抉择问题，也就是博弈方可能在博弈过程中改变均衡策略设定的行为，从而使得均衡策略存在可信性问题，而且纳什均衡无法消除这种问题，只有子博弈完美纳什均衡能够解决它。

子博弈完美纳什均衡一定是纳什均衡，但纳什均衡不一定是子博弈完美纳什均衡。因此一个动态博弈的所有子博弈完纳什均衡是该博弈所有纳什均衡的一个子集。

14、博弈方的理性问题对动态博弈分析的影响肯定比对静态博弈分析的影响更大。

参考解答：虽然博弈方的理性问题，博弈方实际理性与博弈分析假设的有差距，对博弈分析的影响在静态博弈分析中也存在，教材第二章多次提到了这个问题，但博弈方的理性问题对动态博弈分析的影响肯定更大。因为以子博弈完美纳什均衡和逆推归纳法为核心的动态博弈分析，对博弈方理性的要求比静态博弈的纳什均衡分析的更高，而且博弈方理性的缺陷还会引出理性判断的动态调整等更复杂的问题。例如某个博弈方由理性问题在某时刻“犯错误”，采用偏离子博弈完美纳什均衡的行为、路径，这时候后面阶段行为博弈方的判断和行为选择就会有困难。这种困难是动态博弈所特有的，在静态博弈分析中并不存在。

15、三寡头市场有需求函数P=100-Q,其中Q是三厂商的产量之和，并且已知三个厂商都有常数边际成本。如果厂商1和2先同时决定产量，厂商3根据厂商1和2的产量决策，问他们他们各自的产量和利润是多少？

参考解答：

首先，设三个厂商的产量分别为q1、q2和q3.三个厂商的利润函数为：

π1=（100—q1—q2—q3）q1—2q1 π2=（100—q1—q2—q3）q1—2q2 π3=（100—q1—q2—q3）q1—2q3

根据逆推归纳法，先分析第二阶段是厂商3的选择。将厂商1的利润函数对其产量求偏导数并令其为0得：

??3=100—q1—q2—2q3—2=0 ?q3因此厂商3的反应函数为：

q3=（98—q1—q2）/2

再分析第一阶段是厂商1和厂商2的决策。先把厂商3的反应函数代入厂商1和厂商2的利润函数得：

98-q1-q2π1=（100—q1—q2—q3）q1—2q1=q1

298-q1-q2π2=（100—q1—q2—q3）q2—2q2=q2

2分别对q1和q2求偏导数并令为0得：

??198-q2?-q1=0

2?q1??198-q1?-q2=0

2?q1联立两个方程可解得q1=q2=98/3。再代入厂商3的反应函数得q3=（98-q1-q2）/2=98/6。

把三个厂商产量代入各自的利润函数，可得三个厂商的利润分别为4802/9、4802/9和2401/9。

16、判断下列论述是否正确，并进行分析：

a) 在动态博弈中，因为后行为的博弈方可以先观察对方行为后再选择行为，

因此总是有利的。

b) 逆推归纳法并不能排除所有不可置信的威胁。

c) 如果动态博弈的一个策略组合在均衡路径上是纳什均衡，就构成了该动态博弈的一个子博弈完美纳什均衡。

参考答案：

a) 不正确。实际上动态博弈中先行为的博弈方往往有先行优势，因此常常

是先行为的博弈方更有利而不是后行为的博弈方有利。

b) 不正确。逆推归纳法最根本的特征就是能排除动态博弈中的所有不可信

的行为，包括不可信的威胁和不可信的承诺。因为逆推归纳法使根据最大利益原则选择博弈方每阶段行为的，而且都考虑到了后续阶段的行为选择，因此用逆推归纳法找出的均衡策略组合中不可能包含不符合博弈方利益的不可信行为选择。

c) 不正确。因为动态博弈的子博弈完美纳什均衡不仅要求在均衡路径上是

纳什均衡，而且还要求在非均衡路径上也是纳什均衡。

17两个兄弟分一块冰激凌。哥哥先提出一个分割比例，弟弟可以接受或拒绝，接受则按哥哥的提议分割，若拒绝就自己提出一个比例。但这时候冰激凌已化得只剩1/2了，对弟弟提议的比例哥哥也可以接受或拒绝，若接受则按弟弟的建议分割，若拒绝冰激凌会全部化光。因为兄弟之间不应该做损人不利己的是，因此我们假设接受和拒绝利益相同时兄弟俩都会接受。求该博弈的子博弈完美纳什均衡。如果冰激凌每阶段只化掉1/3，博弈的子博弈完美纳什均衡是什么？参考答案：

根据问题，如果我们假设哥的方案是S1：1-S1，其中S1是自己的份额，弟的方案是S2：1-S2，S2是哥的份额，那么可用如下的扩展形表示该博弈：

哥出S1 弟接受不接受，出S2 哥 (S1,1-S1) 接受不接受，出S2

运用逆推归纳法先分析最后一阶段哥的选择。由于只要接受的利益不少于不接受的利益哥就会接受，因此在这个阶段只要弟的方案满足S2/2≥0，也就是S2≥0，哥就会接受，否则不会接受。由于冰激凌的份额不可能是负数，因此该条件实际上必然是成立的，也就是说因为哥不接受弟的方案冰激凌会全部化掉，因此任何方案哥都会接受。

(S2/2,(1-S2)/2) )

(0,0)

现在回到前一阶段弟的选择。由于弟知道后一阶段哥的选择方法，因此知道

如果不接受前一阶段哥提出的比例，自己可以取S2=0，独享此时还未化掉的1/2块冰激凌；如果选择接受前一阶段哥的提议，那么自己将得到1-S1，显然只要1-S1≥1/2，即S1≤1/2，弟就会接受哥的提议。

再回到第一阶段哥的选择。哥清楚后两个阶段双方的选择逻辑和结果，因此他在这一阶段选择S1=1/2，正是能够被弟接受的自己的最大限度份额，超过这个份额将什么都不能得到，因此S1=1/2是最佳选择。

综上，该博弈的子博弈完美纳什均衡是：哥哥开始时就提议按(1/2,1/2)分割，弟弟接受。

18、如果学生在考试之前全面复习，考好的概率为90%，如果学生只复习一部分重点，则有50%的概率考好。全面复习花费的时间t1=100小时，重点复习之需要花费t2=20小时。学生的效用函数为：U=W-2e，其中W是考试成绩，有高低两种分数Wh和Wl，e为努力学习的时间。问老师如何才能促使学生全面复习？参考答案：

本题中老师的调控手段是高分和低分的水平，或者高分和低分的差距，老师给学生高低分并没有成本，老师也不用考虑自己的收益或效用。

如果引进不确定性的博弈方O,可以得到该博弈的扩展形如下：

学生全面重点 0 高分（0.9）低分（0.1）高分（0.5） 0 低分（0.5）

(Wh-200）（Wl-200）（Wh-40）（Wl-40）

学生选择全面复习的期望得益是

U1=0.9（Wh-200）+ 0.1 (Wl-200 ) 重点复习的期望得益是

U2=0.5（Wh-40）+ 0.5(Wl-40 )

只有当U1?U2时学生才会选择全面复习。根据U1?U2我们可以算出

Wh- Wl ?400。这就是老师能有效全面复习需要满足的条件。其实在奖学金与成绩挂钩时，Wh- Wl也可以理解成不同等奖学金的差额。

19、设两个博弈方之间的一个三阶

1 段动态博弈如右图所示,

1）若a，b分别为10和15，该博弈 L R 的子博弈完美纳什均衡策略是什么？ 2） R—M—T 是否可能成为该博弈的子

2 博弈完美纳什均衡路基路径,为什么? (30,0) 3) 在什么情况下博弈方2会获得30 M N 或更高的得益。

1 (20,20) S T

(a,b) (5,30) 参考答案:

1)该博弈的子博弈完美纳什均衡策略是：博弈方1在第一阶段选L，在第三阶段选

S，博弈方2在第二阶段选M。

2）不可能，因为R—M—T给博弈方1的得益5小于他在第一阶段选L的得益30，因此该路径对应的策略组合不构成纳什均衡。 3）当a>30,b≥30时, 博弈方2会获得30或更高的得益。

20、简要评论博弈论在微观经济学运用中的优缺点。参考解答略。

19、设两个博弈方之间的一个三阶

1 段动态博弈如右图所示,

1）若a，b分别为10和15，该博弈 L R 的子博弈完美纳什均衡策略是什么？ 2） R—M—T 是否可能成为该博弈的子

2 博弈完美纳什均衡路基路径,为什么? (30,0) 3) 在什么情况下博弈方2会获得30 M N 或更高的得益。

1 (20,20) S T

(a,b) (5,30) 参考答案:

1)该博弈的子博弈完美纳什均衡策略是：博弈方1在第一阶段选L，在第三阶段选

S，博弈方2在第二阶段选M。

20、简要评论博弈论在微观经济学运用中的优缺点。参考解答略。

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说综合文库wh 博弈题及参考答案在线全文阅读。

wh 博弈题及参考答案.doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/zonghe/262060.html（转载请注明文章来源）

上一篇：2010学年第一学期八年级期中考试英语试卷
下一篇：高二课堂翻译练习4