博弈论学习笔记(2)——完全信息静态博弈

 前言

这部分我们学习的是完全信息静态博弈,主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。

零、绪论

1、什么是博弈论

1)博弈的定义

博弈论:研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

完全理性的个人或群体发生直接相互作用的情形。博弈论研究这种情形下个人或群体的决策以及这种选择所导致的结果的理论。

2)博弈与传统决策的区别

传统的决策是从若干备选方案中选择一个有利方案,如出门带伞问题就是一个决策问题。而博弈是研究决策主体的行为发生直接相互作用时候的决策,在博弈中,决策主体的选择不仅与决策主体的偏好结构有关,而且与其他人的选择有关。

2、如何研究博弈论

1)完全理性假设的主要表现
  1. 参与人的偏好具有一致性

  2. 参与人对面临的决策问题具有完全的理解

  3. 参与人具有强大的逻辑推理能力和计算能力

2)共同知识是什么

如果有一种每个参与人都知道的“信息或事件”,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它,……,如此等等,那么这种“信息”对于参与人而言就是共同知识。显然关于一个事件的共同知识这个概念比人们所熟悉的“相互知识”需要更多的信息,共同知识是无穷尽的“相互知识”。

有了参与人完全理性和参与人完全理性是共同知识这两个假设,就可以确保博弈过程的分析具有逻辑上的一致性。

3、博弈论研究的目的

1)什么是博弈问题的解

所有参与人都预测到的博弈结果,即参与人的一致性预测

将Nash均衡作为博弈问题的一致性预测,也就是博弈问题的解。

4、博弈论的主要分类

1)合作博弈与非合作博弈

决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议

2)静态博弈与动态博弈

根据参与人的先后顺序。

3)完全信息博弈与不完全信息博弈

参与人对其他参与人的特征,战略空间及支付函数在博弈开始时是否已知。

4)完美信息博弈与不完美信息博弈

注意完美信息博弈与完全信息博弈的比较

一、战略式博弈

1、基本概念

1)参与人

博弈中选择行动以最大化自己效用的决策主体

2)行动

参与人在博弈的某个时点的决策变量

3)行动组合(行动断面)

博弈中每个参与人采取一个行动的一种博弈情形

4)战略

参与人的行动规则,规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。它是与博弈行动顺序相关的行动有序集,战略是行动的规则,而不是行动本身,作为行动规则,战略必须是完备的。

【特例】

在完全信息静态博弈中,不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始那一时刻决策,因此所有参与人面临的决策情形只有一种。参与人的战略集与行动集相同。

5)战略组合

博弈中每个参与人采取战略组合中相应战略Si的一种博弈情形。

6)支付

参与人在博弈中的所得。参与人的支付就可表示为一种特定博弈情形(如行动组合或战略组合)下参与人得到的确定效用水平或期望效用水平。

7)信息

参与人所具有的有关博弈的所有的知识。

8)完美信息与完全信息

9)结果

博弈分析者所感兴趣的所有东西,如:均衡策略组合、均衡行动组合、均衡支付等。

10)均衡

所有参与人的最优的战略组合。在博弈论中,均衡是指所有个人的买卖规则(战略)的组合,均衡价格是这种战略组合的结果。

2、战略式博弈

1)战略式博弈的定义

战略式博弈是博弈问题的一种规范性描述,亦称为标准式博弈。

战略式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略),并且这些选择是同时进行的。

二、Nash均衡

1、占优均衡

1)“囚徒困境”

理性的前提假设,使得每个小偷都有背离“抵赖,抵赖”的意愿,因此,小偷的选择会偏离“抵赖”,而选择“坦白”。

无论对方如何选择,每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略,而与其他小偷的选择无关。

在学习占优行为、重复剔除劣战略行为这章之前,不妨做一做下面这道题。

【收益矩阵的参数范围问题】

题解】

2)占优战略

参与人的最优战略与其他参与人的选择无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略我们称为“占优战略”(dominant strategy)

3)占优行为

在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略。参与人的这种选择行为我们称为占优行为。占优行为是理性参与人选择行为的最基本特征。

4)占优战略均衡

如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略。

博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategy equilibrium)。

2、重复剔除劣战略行为

1)劣战略

2)剔除劣战略行为

3)重复剔除的占优均衡

4)弱劣战略

5)均衡结果是否与劣战略的剔除顺序有关

一般而言,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱战略,均衡结果可能与剔除顺序有关

在重复剔除劣战略的过程中,需要注意:

  • 重复剔除劣战略均衡要求“理性”为“共同知识”

  • 一般而言,参与人的战略空间越大,需要剔除的步骤就越多,对“理性”的要求就越严格。

3、Nash均衡

1)什么是博弈问题的解
  1. 博弈分析是在博弈问题的结构参与人完全理性为共同知识下进行的;

  2. 对博弈问题的求解,等同于完全理性的参与人对博弈的求解;

  3. 博弈问题的解:所有参与人的一致性预测。

2)什么是Nash均衡

3)求解Nash均衡的方法

划线法】

在两人博弈中,相互构成最优战略的战略组合就是Nash均衡。

箭头法】

在两人博弈中,一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。计算步骤如下:

  1. 对于每个战略组合,检查是否有参与人会偏离

  2. 找出没有参与人会偏离的战略组合

4)Nash均衡 VS 占优战略均衡 VS 重复剔除的占优均衡

4、混合战略Nash均衡

1)混合战略

以一定的概率分布来选择自己战略的行为,在博弈中称之为混合战略。与此相对应,参与人在给定信息下只选择一种特点战略,成为纯战略。

混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略混合战略为定义在纯战略集上的一个概率分布。

2)混合战略的支付

对于混合战略,参与人的支付是不确定的,此时,参与人关心的是支付的期望收益

3)混合战略与混合战略组合

4)纯战略-混合战略 VS 完全混合战略

5)混合战略Nash均衡

6)最优混合战略的特性

7)支集

8)最优反应的引理

5、混合战略Nash均衡的求解

1)等值法

【举例说明】

2)Wilson奇数定理

3)支撑是什么

掌握支撑的写法

4)支撑求解法

支撑法求解过程中可能遇到的问题:

5)支撑法求解典例

6)支撑法的问题,计算量大

用剔除劣战略的方法,排除支撑!!!

7)规划求解法

8)规划法求解典例

从理论上来讲,这两种方法对有限战略式博弈都是适用的,但从以上例子的求解过程来看,都存在着计算过程复杂,计算量大等问题,尤其是对多人(即参与人人数大于2)博弈问题。当参与人人数大于2时,使用支撑法,就必须求解非线性方程组;而使用规划法,就必须求解一个无论是目标函数还是约束条件都是非线性的规划问题。

三、Nash均衡解的特性

1、Nash均衡的意义

1)一致性预测

Nash均衡是博弈中的一种一致性预测——如果所有参与人预测一个特点的Nash均衡会出现,那么所有参与人都不会偏离,这个Nash均衡就会出现。

2)Nash均衡的特点

对任一个参与人i,在给定其他参与人选择的情况下,均衡战略是自己的最优战略

3)一般解的定义

2、Nash均衡解的存在性

1)不同均衡概念之间的关系

2)Nash均衡的存在性定理

每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。

3、Nash均衡解的多重性

1)什么是Nash均衡的多重性问题

传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题),而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)

但事实上,当在一个博弈中存在多个Nash均衡时,目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。

2)如何解决Nash均衡的多重性问题

1、均衡精炼的方法

从博弈解的定义入手,在Nash均衡的基础上,通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等,剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性,对所有的博弈问题都适用;

均衡精炼的方法可以称为规范式的方法,其它的方法称为非规范式的方法。

2、非规范式的方法

  • 焦点效应

  • 相关均衡

3)什么是焦点效应

在一个具有多重均衡的博弈中,趋向于将参与人的注意力集中到一个均衡的任何事情,都可能使参与人全都预期并随之实行这个均衡,就像一个自行应验的预言一样。

Schelling将这种现象称之为焦点效应 (focal-point effect)。

在焦点效应中具有某种使它显著地区别于所有其它均衡性质的均衡,被称为“焦点均衡”(focal equilibrium)。

结合“性别战”的例子理解,详见PPT

  1. 博弈的现实状况或背景也会将博弈引向特定的均衡。

  2. 此外,“焦点效应”在某些博弈中还可能由均衡战略自身的性质来确定。

但是需要注意的是,聚焦因素只有针对Nash均衡时才可能是有效的。

4)什么是廉价磋商

类似于“性别战”中这种博弈之前进行的沟通或商议,在博弈分析中称之为具有通信的博弈或“廉价磋商”(cheap talk)。

在博弈分析中,将参与人在博弈开始之前,不花任何成本所达成的、对参与人没有约束力的协议称为“廉价磋商”。

5)什么是相关均衡

在“性别战”博弈中,夫妻双方通过长期的共处,在周末娱乐项目的选择上可能会形成这样的习惯:双方根据周末的天气状况来选择娱乐项目。

便得到了一种解决Nash均衡多重性问题的方式:让参与人根据某个共同观测到的信号(如“性别战”中的天气状况)来选择行动。

如果参与人根据信号选择行动的规则本身能够构成一个Nash均衡,那么参与人就可能会根据某个共同观测到的信号来选择行动。这种由参与人的行动规则所构成的Nash均衡,就是Aumann定义的“相关均衡”(correlated equilibrium)。

四、Nash均衡的应用

1、Cournot寡头竞争模型

该模型研究了寡头垄断市场中,企业追求利润最大化时的决策问题。

1)Cournot模型的基本假设

2)什么是反应函数

上面两个函数分别描述了给定对手的产量,企业 i 应该如何反应,因而分别称为企业1与企业2的反应函数(reaction function)。

反应函数意味着每个企业的最优产量是另一个企业的产量的函数,两个反应函数的交点便是Nash均衡点。

3)Cournot模型的计算

联合垄断市场、“垄断最优的情形在两个寡头的时候是无法达到”等内容详见PPT

2、Bertrand寡头竞争模型

在寡头垄断市场中,企业关心更多的可能是自己的产品在市场上的价格,而不是生产多少产品,也就是说,企业进行的可能是价格竞争而不是产量竞争。

1)Bertrand模型的基本假设

2)Bertrand模型的计算

3)Bertrand悖论

3、Hotelling寡头竞争模型

在Hotelling价格竞争模型中,Hotelling通过引入产品在空间位置上的差异,巧妙地解决了产品的差异形式的描述问题。

在Hotelling价格竞争模型中,产品虽然仍是同质的,但其在空间位置上有差异,因而对于不同位置的消费者其运输成本不同,由此导致产品不再是完全替代的。

1)Hotelling模型的基本假设

2)Hotelling模型的求解

通过引入产品的位置差异,使得企业的均衡利润不再为0,而企业的定价也大于产品的边际成本,在一定程度上解释了Bertrand悖论。

在上面的分析中,我们将两个企业固定于线性城市的两端。如果允许企业在选择价格的同时还可以选择位置,那么两个企业都会选择线性城市的中点(即[0,1]区间的中点),而当两个企业都位于中点时,Bertrand均衡则成为模型的唯一均衡。

4、Hardin公共财产问题

公共资源被过度使用,如草原沙化,渔业资源枯竭以及各种矿产资源的过度开发等等,使人类社会的生存面临着极大的挑战。以G. Hardin的公共财产模型为例,分析人们的利己行为如何使得公共资源被过度使用。

具体求解过程详见PPT

5、混合战略Nash均衡的应用

1)小偷-守卫博弈

2)监督博弈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/175861.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java架构师软件架构的演化和维护

目录 1 导学2 软件架构演化和定义3 面向对象软件架构演化4 软件架构演化方式的分类5 软件架构演化原则6 软件架构演化评估方法7 大型网站架构演化8 软件架构维护想学习架构师构建流程请跳转:Java架构师系统架构设计 1 导学 2 软件架构演化和定义 软件架构的演化和维护就是对…

Kafka - 异步/同步发送API

文章目录 异步发送普通异步发送异步发送流程Code 带回调函数的异步发送带回调函数的异步发送流程Code 同步发送API 异步发送 普通异步发送 需求&#xff1a;创建Kafka生产者&#xff0c;采用异步的方式发送到Kafka broker 异步发送流程 Code <!-- https://mvnrepository…

飞鼠异地组网工具全网互通实战指南

飞鼠异地组网工具全网互通实战指南 一、飞鼠异地组网工具介绍1.1 飞鼠工具简介1.2 飞鼠工具官网 二、本次实践介绍2.1 本次实践前提2.2 本次实践简介2.3 本次实践环境规划 三、异地组网配置3.1 进入中心控制器节点管理后台3.2 网卡设置3.3 进入子网节点管理后台3.4 网卡设置 四…

项目综合实训,vrrp+bfd,以及策略路由的应用

目录 一&#xff0e; 项目需求 二&#xff0e; Visio设备画图 三&#xff0e; 设备选型 三&#xff0e;vlan规划 四&#xff0e;Ip地址规划 五&#xff0e;实验拓扑图 六&#xff0e;配置过程及结果 项目需求 1.S1作为VLAN10的主网关和根桥&#xff0c;S2作为v…

Pytorch L1,L2正则化

L1正则化和L2正则化是常用的正则化技术&#xff0c;用于在机器学习模型中控制过拟合。它们的主要区别在于正则化项的形式和对模型参数的影响。 L1正则化&#xff08;Lasso正则化&#xff09;&#xff1a; 正则化项形式&#xff1a;L1正则化使用模型参数的绝对值之和作为正则化…

Emscripten + CMakeLists.txt 将 C++ 项目编译成 WebAssembly(.wasm)/js,并编译 Html 测试

背景&#xff1a;Web 端需要使用已有的 C 库&#xff08;使用 CMake 编译&#xff09;&#xff0c;需要将 C 项目编译成 WebAssembly(.wasm) 供 js 调用。 上篇文章《Mac 上安装 Emscripten》 已讲解如何安装配置 Emscripten 环境。 本篇文章主要讲解如何将基于 CMakeLists 配…

Gitee 发行版

Gitee 发行版 1、Gitee 发行版管理2、项目仓库中创建发行版本3、项目中导入3.1 gradle配置3.2 dependencies执行正常&#xff0c;包没有下载 1、Gitee 发行版管理 Gitee 发行版&#xff08;Release&#xff09;管理 2、项目仓库中创建发行版本 按照Gitee官网操作就行 3、项目…

PCIe 访问 EP 配置空间,空间映射详解,BDF 计算偏移

访问 EP 的配置空间方法 内存映射IO 访问 内存访问配置空间 前置知识 PCIe 设备的寻址是按照 BDF 即 Bus-Device-Function 来组织的。访问某个设备则需要根据BDF计算偏移地址。 两种不同的内存访问配置空间方法 类 xilinx&#xff0c;基地址 偏移地址访问 // linux-5.10\…

http1,https,http2,http3总结

1.HTTP 当我们浏览网页时&#xff0c;地址栏中使用最多的多是https://开头的url&#xff0c;它与我们所学的http协议有什么区别&#xff1f; http协议又叫超文本传输协议&#xff0c;它是应用层中使用最多的协议&#xff0c; http与我们常说的socket有什么区别吗&#xff1f; …

【ARM 嵌入式 C 入门及渐进 10 -- 冒泡排序 选择排序 插入排序 快速排序 归并排序 堆排序 比较介绍】

文章目录 排序算法小结排序算法C实现排序方法的稳定性 排序算法小结 C语言中常用的排序算法包括冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序。下面我们来一一介绍&#xff1a; 冒泡排序&#xff08;Bubble Sort&#xff09;&#xff1a;冒泡排序是通过比较相邻…

android 8.1 disable unsupported sensor

如果device不支持某种sensor,可以在android/frameworks/base/core/java/android/hardware/SystemSensorManager.java里将其disabled掉。以disable proximity sensor为例。 public SystemSensorManager(Context context, Looper mainLooper) {synchronized(sLock) {if (!sNativ…

MWeb Pro for Mac:博客生成编辑器,助力你的创作之旅

在当今数字化时代&#xff0c;博客已经成为了许多人记录生活、分享知识和表达观点的重要渠道。而要打造一个专业、美观且易于管理的博客&#xff0c;选择一款强大的博客生成编辑器至关重要。今天&#xff0c;我向大家推荐一款备受好评的Mac软件——MWeb Pro。 MWeb Pro是一款专…

flutter深研

https://www.douyin.com/video/7020336319058627853 关闭系统风扇 在 Windows 操作系统上安装和配置 Flutter 开发环境 - Flutter 中文文档 - Flutter 中文开发者网站 - Flutter 下载Git - Downloading Package 推荐使用迅雷下载 系统配置要求 要想安装和运行 Flutter&#xf…

使用FastAPI部署Ultralytics YOLOv5模型

YOLO是You Only Look Once(你只看一次)的缩写&#xff0c;它具有识别图像中的物体的非凡能力&#xff0c;在日常应用中会经常被使用。所以在本文中&#xff0c;我们将介绍如何使用FastAPI的集成YOLOv5&#xff0c;这样我们可以将YOLOv5做为API对外提供服务。 Python有几个web框…

如何将 ruby 打包类似于jdk在另一台相同架构的机器上面开箱即用

需求 目前工作中使用到了ruby作为java 项目的中转语言&#xff0c;但是部署ruby的时候由于环境的不同会出现安装依赖包失败的问题&#xff0c;如何找到一种开箱即用的方式类似于java 中的jdk内置jvm这种方式 解决 TruffleRuby 完美解决问题&#xff0c;TruffleRuby 是使用 T…

基于STC系列单片机实现外部中断0控制按键调节定时器0产生PWM(脉宽调制)的功能

#define uchar unsigned char//自定义无符号字符型为uchar #define uint unsigned int//自定义无符号整数型为uint sbit PwmOut P1^0;//位定义脉宽调制输出为单片机P1.0脚 uchar PwmTimeCount;//声明脉宽调制时间计数变量 uchar PwmDutyCycle;//声明脉宽调制占空比变量 void Ti…

Apache服务的搭建与配置(超详细版)

前言 Apache是一种常见的Web服务器软件&#xff0c;广泛用于Linux和其他UNIX操作系统上。它是自由软件&#xff0c;可以通过开放源代码的方式进行自由分发和修改。Apache提供了处理静态和动态内容的能力&#xff0c;而且还支持多种编程语言和脚本&#xff0c;如PHP、Python和P…

python数据可视化

内容主要介绍了python模块matplotlib即seaborn数据可视化 matplotlib模块通过import matplotlib.pyplot as plt生成图形&#xff0c;如生成图形没展示&#xff0c;可调用plt.show()方法展示图形&#xff1b; 对于颜色属性设置&#xff0c;既可以使用十六进制颜色表达(#7777aa…

cdrx8和2020哪个版本更好用?有什么区别

经过多年的发展&#xff0c;cdr推出了很多优秀的版本&#xff0c;并顺应时代的发展更新了多项功能。随着cdr推出的软件版本增多&#xff0c;小伙伴们可选择的产品也在增多&#xff0c;那么该怎么选择呢&#xff1f;本文会给大家介绍cdrx8和2020的区别&#xff0c;CDRX8和2020哪…

Pytorch 猫狗识别案例

猫狗识别数据集https://download.csdn.net/download/Victor_Li_/88483483?spm1001.2014.3001.5501 训练集图片路径 测试集图片路径 训练代码如下 import torch import torchvision import matplotlib.pyplot as plt import torchvision.models as models import torch.nn as…