《 博弈论教程(罗云峰版) 》——习题二答案

前言 

博弈论这门课程,我们主要参考的教材是《博弈论教程(罗云峰版)》,但是罗老师的课后习题并没有给出完整的答案,秉着学习的态度,本人结合教材和 PPT 在这里给出课后习题的答案。

由于我们只学了完全信息静态博弈和完全信息动态博弈,即第一部分和第二部分,因此,本人只写了习题一和二。在写题的过程中难免出错,欢迎大家指出,同时希望能够给大家提供一些帮助。

1、概念理解

(1)扩展式博弈的基本构成要素是什么?如何将一个扩展式博弈转换为战略式博弈?

题解】

(2)博弈树的基本构成要素是什么?在博弈树中,轮到每个参与人决策时,其决策环境用什么来描述?

题解】

所谓博弈树就是由结和有向枝构成的“有向树”。

(3)什么是参与人的信息集?引入信息集的目的是什么?在博弈树中如何表示信息集?试举例说明。

题解】

为了将“企业2行动时是否知道自己是在博弈树中的点x2 上还是在点x3 上”这一点说清楚,需要引入“信息集”(information set)的概念

可以在博弈树中将同一信息集中的决策结用虚线连接起来。

(4)什么是完美记忆假设?该假设对动态博弈分析有何意义?试举例说明

题解】

假设参与人不会忘记以前知道或者做过的事情。

在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么我们也就无法对博弈进行预测。

(5)什么是完美信息?完美信息和完全信息有什么区别?在博弈树中,完美信息意味着什么?

题解】

所谓完美信息的博弈是指每个参与人决策时都没有不确定性,也就是说,在博弈树中每个参与人的信息集都是单决策结的。

(6)什么是子博弈?子博弈和原博弈有何异同?试举例说明。

题解】

(7)动态博弈分析中为什么要引进子博弈精炼Nash均衡,它与Nash均衡之间是什么关系?试用一个例子说明子博弈精炼Nash均衡如何对Nash均衡进行精炼。

(8)有限扩展式博弈是否一定存在唯一的子博弈精炼Nash均衡?

题解】

(9)逆向归纳法是否仅适用于完美信息动态博弈?为什么?试举例说明

题解】

逆向归纳法(Backward Induction)是一种解决动态博弈中的策略选择问题的方法。通过逆向思考,从最后的决策回溯到初始的决策节点,在这个过程中确定每个节点的最优策略。逆向归纳法是一种通用的方法,可以适用于完美信息动态博弈和不完美信息动态博弈。

在完美信息动态博弈中,参与者对博弈中所有信息都是完全了解的。参与者可以清楚地知道对手的策略选择和结果,因此可以采用逆向归纳法来寻找最优策略。

在不完美信息动态博弈中,参与者可能面临诸如信息不对称和未知概率等问题。这些因素会影响参与者的决策选择,并使得逆向归纳法难以应用。但是,如果我们加入一些假设,例如参与者有限理性或者遵循某些规则,逆向归纳法仍然可以用于分析不完美信息动态博弈。

下面通过一个例子来说明逆向归纳法在不完美信息动态博弈中的应用:

假设有两个零售商A和B,他们同时决定在某个购物平台上销售自己的产品或者不销售。他们都知道自己的产品售价和成本,但不知道对方的售价和成本。如果两家零售商都选择销售,他们的利润将会减少。如果只有一家零售商销售,那么该零售商将赢得所有的市场份额。

在这种情况下,参与者面临着信息不对称问题。在这种情况下,如果我们假设参与者有限理性,即他们不能完全理解对手的策略选择和结果,那么我们可以使用逆向归纳法来确定最优策略。

首先,我们可以从最后的决策开始,即假设零售商B选择销售,那么零售商A的最优策略是不销售,因为此时只有一个零售商销售,A可以赢得所有的市场份额,获得更高的利润。如果零售商B选择不销售,那么零售商A的最优策略是销售,因为此时只有零售商A销售,他可以赢得所有的市场份额,获得更高的利润。

通过逆向归纳法,我们可以确定每个节点的最优策略,从而确定整个博弈的最优策略。虽然该博弈存在信息不对称问题,但是我们可以通过假设参与者有限理性来应用逆向归纳法来分析和解决问题。

(10)什么是承诺?什么是可信的承诺?试举例说明。

题解】

(11)你认为子博弈精炼Nash均衡能够解决Nash均衡的多重性问题吗?为什么?试举例说明。

题解】

对于完美信息的博弈问题来说,子博弈精炼Nash均衡完全满足动态规划的最优性原理,即在任何决策时点上,子博弈精炼Nash均衡都能给出参与人的最优选择。此时,子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理、不可置信的行动

但是根据Kuhn定理,不能保证扩展式博弈只存在唯一的子博弈精炼Nash均衡。

(12)有限重复博弈和无限重复博弈的区别是什么?有限重复博弈的子博弈和无限重复博弈的子博弈的区别是什么?在无限重复博弈中,为什么一定要考虑参与人收益的贴现?

题解】

ChatGPT如是说(辩证看待,不一定是正确的):

有限重复博弈和无限重复博弈是两种不同类型的博弈,其区别在于博弈的进行次数和博弈的结束条件。

  1. 有限重复博弈:在有限重复博弈中,参与者在一定的回合数内进行博弈,并且预先确定了博弈的回合数。博弈的结束条件是达到了预设的回合数,每个回合的博弈都可以看作是一个子博弈。

  2. 无限重复博弈:在无限重复博弈中,参与者可以无限次地进行博弈,没有预先确定的结束条件。博弈可以一直持续下去,形成无穷多个子博弈。

在有限重复博弈和无限重复博弈中,子博弈的区别在于:

  1. 有限重复博弈的子博弈:在有限重复博弈中,每个回合的博弈可以看作是一个子博弈,这些子博弈之间是相互独立的,其结果并不会影响下一回合的博弈。因此,在有限重复博弈中,每个子博弈都可以单独分析和求解。

  2. 无限重复博弈的子博弈:在无限重复博弈中,博弈的进行是连续不断的,形成了无穷多个子博弈。每个子博弈的结果可能会影响下一回合的博弈,参与者在决策时需要考虑到未来的影响。因此,在无限重复博弈中,子博弈之间存在着时间序列上的依赖关系,需要采用动态策略来考虑整个博弈序列。

在无限重复博弈中,要考虑参与者收益的贴现的原因主要有两点:

  1. 时间价值:由于博弈是无限次进行的,未来的收益相对于当前收益存在时间价值,即未来的收益价值相对较低。为了综合考虑当前和未来的收益,我们需要对未来收益进行贴现,将其转化为当前的价值。

  2. 策略的影响:在无限重复博弈中,参与者的策略选择可能会对未来的博弈产生影响。通过考虑收益的贴现,参与者可以更好地权衡当前选择和未来影响,从而制定更为长远和优化的策略。

因此,在无限重复博弈中,考虑参与者收益的贴现可以更准确地反映参与者的决策思考和行为选择,有助于确定最优策略并预测博弈的结果。

(13)在无限重复博弈中,参与人的任何可行收益是否一定能通过触发战略得到?其条件是什么?

题解】

在一定的贴现率下,给出的触发策略能构成Nash均衡。

根据无名氏定理,要使得任何可行收益通过触发策略得到,需要贴现率足够接近1

(14)在无限重复博弈中,在一定贴现率下,触发战略在阶段博弈中无法得到的可行收益,是否可以通过其他战略得到?试举例说明。

题解】

通过承诺行动,使不可信的威胁变得可信,改变博弈问题的结构。因为对将来行动所作的可信威胁或承诺可以影响到当前的行动。

(15)在重复博弈中,使参与人达到合作的“最严厉的惩罚”是什么?试举例说明。

题解】

(16)“一报还一报”有什么特点?Axelrod实验是否意味着:在任何情况下,“一报还一报”战略都是参与人的最优战略?

题解】

ChatGPT如是说:

Axelrod实验并不意味着“一报还一报”战略(也称为“逆向恶报”或“逆向承诺”战略)在任何情况下都是参与人的最优策略。事实上,最优策略取决于博弈的具体规则和其他参与者的行为。

在Axelrod实验中,“一报还一报”战略表现得非常成功,因为它能够避免陷入恶性循环并且能够建立信任。但是,在其他类型的博弈中,“一报还一报”战略可能并不是最优战略。

例如,在某些博弈中,参与者可能需要采取更具攻击性的策略来获得更高的收益,而在其他博弈中,参与者可能需要采取更合作的策略来维护关系并获得共赢结果。因此,在特定的博弈规则和其他参与者的行为下,最优策略可能会发生变化。

总之,Axelrod实验提供了有关博弈行为的重要见解,表明在一些情况下,“一报还一报”战略是一个可靠的选择。然而,在不同的博弈规则和参与者策略的情况下,最优策略可能需要进行适当的调整。

(17)试比较Cournot模型和Stackberg模型的异同。在Stackberg模型中,如果企业进行价格决策,你认为模型的均衡会是什么?

题解】

(18)在Leontief劳资谈判模型中,Nash讨价还价是Pareto有效的。但对于Leontief劳资谈判模型所给定的博弈时序,Nash讨价还价解可以得到吗?

题解】

ChatGPT如是说:

Leontief劳资谈判模型是一种博弈论模型,用于解决雇主和工会之间的工资谈判问题。在这个模型中,雇主和工会交替提出工资要求,直到双方达成协议。

对于这个模型,可以使用Nash讨价还价解来得到Pareto有效的结果。然而,在Leontief劳资谈判模型所给定的博弈时序下,可能无法得到Nash讨价还价解。

这是因为,Nash讨价还价解通常适用于只有两个参与者的静态博弈,其中交互发生在单个时间点上。但是,Leontief模型是一个动态博弈,其中交互发生在多个时间点上。在这种情况下,博弈的复杂性增加,很难利用Nash讨价还价解来计算出最优结果。

相反,针对动态博弈,可以使用动态博弈理论中的其他方法,例如“观察到的策略”(Observational strategy)或“观察到的均衡”(Observational equilibrium)等来解决问题。这些方法通常涉及考虑参与者的长期策略和行为,并将其建模为一个序列博弈,从而提供更实际和可行的解决方案。

因此,对于Leontief劳资谈判模型所给定的博弈时序,Nash讨价还价解可能无法得到。但是,其他动态博弈理论的方法可以用于解决这个模型,并提供更实际和可行的解决方案。

11、n个企业的Cournot模型+触发战略,求解贴现率

题解】

最终计算答案正确。

12、n个企业的Bertrand模型+触发战略,求解贴现率

 

题解】

特别说明:由于复习时间有限,没能完成习题二全部题目,只能帮大家到这了,大家加油噢~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/177356.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

sw 怎么装新版本

我们在安装solidworks时,有时候会提示A newer version of this applic ation is already installed. Installation stopped.如下图所示 这时候需要点继续安装 然后会出现下图所示情况,vba7.1安装未成功 这是因为我们电脑中以前安装过更高版本的solidw…

安装opensips

1. 安装opensips ubuntu下安装: 1)执行以下的脚本 openSIPS | APT Repository 2)apt-get install opensips 安装完毕后,再选择需要的module继续安装,不需要编译 如果只是用作load balancer,那么只需要…

arcpy.message实现探索

arcpy 位置D:\Program Files\GeoScene\Pro\Resources\ArcPy\arcpy\__init__.py ”““AddMessage(消息) 创建可以使用任何GetMessages函数访问的地理处理信息消息(Severity0)。 message(字符串):要添加的消息。”“ arcpy.geoprocessing D:\Program Files\GeoScene\Pro\Re…

5.4 完整性约束命名子句

思维导图: 笔记&#xff1a;5.4 完整性约束命名子句 定义: 完整性约束是在CREATE TABLE语句中定义的。SQL为CREATE TABLE语句提供了CONSTRAINT子句&#xff0c;用于对完整性约束进行命名。命名的目的是方便增加或删除约束。 基本结构: CONSTRAINT <完整性约束名称> &l…

python实现MC协议(SLMP 3E帧)的TCP服务端(篇一)

python实现MC协议&#xff08;SLMP 3E帧&#xff09;的TCP服务端是一件稍微麻烦点的事情。它不像modbusTCP那样&#xff0c;可以使用现成的pymodbus模块去实现。但是&#xff0c;我们可以根据协议帧进行组包&#xff0c;自己去实现帧的格式&#xff0c;而这一切可以基于socket模…

jdk官网下载(详细步骤)

jdk全部版本下载网址 Java Archive | Oraclehttps://www.oracle.com/java/technologies/downloads/archive/ 下载之前先建立oracle账号(免费创建)&#xff0c;不用特意去搜&#xff0c;你点击下载jdk的时候会自动弹出来&#xff0c;自己建立一个账号就能下载了 找到自己要下载…

C++数据结构算法篇Ⅰ

C数据结构算法篇Ⅰ &#x1f4df;作者主页&#xff1a;慢热的陕西人 &#x1f334;专栏链接&#xff1a;C算法 &#x1f4e3;欢迎各位大佬&#x1f44d;点赞&#x1f525;关注&#x1f693;收藏&#xff0c;&#x1f349;留言 主要内容讲解数据结构中的链表结构 文章目录 C数据…

PHP服务器端电商API原理及示例讲解(电商接口开发/接入)

下面小编就为大家分享一篇PHP服务器端API原理及示例讲解(接口开发)&#xff0c;具有很好的参考价值&#xff0c;希望对大家有所帮助 相信大家都做过PHP请求电商API接口获取数据&#xff0c;比如淘宝平台商品API接口&#xff0c;订单接口&#xff0c;京东接口&#xff0c;1688接…

Python画图之皮卡丘

Python-turtle画出皮卡丘&#xff08;有趣小游戏&#xff09; 一、效果图二、Python代码 一、效果图 二、Python代码 import turtledef getPosition(x, y):turtle.setx(x)turtle.sety(y)print(x, y)class Pikachu:def __init__(self):self.t turtle.Turtle()t self.tt.pensi…

Android广播BroadcastReceiver

BroadcastReceiver组件 BroadcastReceiver是Android中的一个组件&#xff0c;用于接收和处理系统广播或应用内广播。它可以监听系统事件或应用内自定义的广播&#xff0c;并在接收到广播时执行相应的操作。 广播是一种用于在应用组件之间传递消息的机制。通过发送广播&#x…

如何使用查看器筛选、搜索功能进行数据定位?

前言 我们曾探讨过观测云如何通过将内置视图与查看器相联结&#xff0c;实现更全面的数据关联分析。&#xff08;参见《内置视图联动查看器&#xff0c;实现数据关联分析》&#xff09;这里提到的查看器&#xff0c;实际是一个功能全面且强大的数据查看分析工具。其提供多种搜…

土壤数据库辅助工具SPAW计算土壤导水率

土壤数据库辅助工具SPAW 首先下载SPAW工具 点击打开 根据之前的1比100土壤数据查表得到各个组分含量 其中 Field Capacity是田间持水量 Matric Bulk Density是基质粒密度 参考文章 【SWAT水文模型】ArcSWAT土壤数据库辅助工具SPAW简述

Security ❀ DNS协议常见DOS攻击详解

文章目录 1. DNS协议基础概述2. DNS报文详解2.1. DNS Request 请求包2.2. DNS Reply 响应包 3. DNS Request Flood3.1. 攻击原理3.2. 防护方法3.2.1. TC源认证3.2.2. 被动防御3.2.3. CNAME防护模式3.2.4. *CANME类型解析过程** 4. DNS Reply Flood4.1. 攻击原理4.2. 防护方法 5…

2023年【R1快开门式压力容器操作】最新解析及R1快开门式压力容器操作复审考试

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 R1快开门式压力容器操作最新解析是安全生产模拟考试一点通生成的&#xff0c;R1快开门式压力容器操作证模拟考试题库是根据R1快开门式压力容器操作最新版教材汇编出R1快开门式压力容器操作仿真模拟考试。2023年【R1快…

Express框架开发接口之书城商店原型图

这是利用Axure画的&#xff0c;简单画一下原型图&#xff0c;根据他们的业务逻辑我们完成书城商店API开发 首页 分类 购物车 个人中心

批量采集各类自媒体平台内容为word文档带图片软件【支持18家自媒体平台的爬取采集】

批量采集各类自媒体平台内容为word文档带图片软件介绍&#xff1a; 1、支持头条号、大鱼号、企鹅号、一点号、凤凰号、搜狐号、网易号、趣头条、东方号、时间号、惠头条、WiFi万能钥匙、新浪看点、简书、QQ看点、快传号、百家号、微信公众号的文章批量采集为docx文档并带图片。…

分布式事务(再深入)——分布式事务理论基础 Java分布式事务解决方案

前言 事务(TRANSACTION)是一个不可分割的逻辑单元&#xff0c;包含了一组数据库操作命令&#xff0c;并且把所有的命令作为一个整体向系统提交&#xff0c;要么都执行、要么都不执行。 事务作为系统中必须考虑的问题&#xff0c;无论是在单体项目还是在分布式项目中都需要进行…

力扣:147. 对链表进行插入排序(Python3)

题目&#xff1a; 给定单个链表的头 head &#xff0c;使用 插入排序 对链表进行排序&#xff0c;并返回 排序后链表的头 。 插入排序 算法的步骤: 插入排序是迭代的&#xff0c;每次只移动一个元素&#xff0c;直到所有元素可以形成一个有序的输出列表。每次迭代中&#xff0c…

c++ Vector 学习

vevtor 是c 中自带得动态数组&#xff0c;dynamic array array can hold different values/objects of same type 可以装不同得类型或者对象 dynamic size can be changed at runtime 可以运行得时候改变 要使用的话&#xff0c;先引入 #include <vector> std::vector…

性能压力测试主要目标及步骤

性能压力测试是软件开发生命周期中至关重要的一部分&#xff0c;旨在评估应用程序或系统在高负载和极端条件下的性能表现。这种测试有助于发现性能瓶颈、资源耗尽和错误&#xff0c;以确保应用程序在真实使用情况下的可靠性和稳定性。本文将探讨性能压力测试的概念、方法和最佳…