【博弈论3——二人博弈的纳什均衡】

1.俾斯麦海之战

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 零和博弈的定义

零和博弈(Zero-Sum Game)是一种博弈论的基本概念,指的是在博弈过程中,博弈参与者之间的收益和损失之和总是一个常数,特别是总和为零。即博弈一方的收益必然等于另一方的损失,不存在共赢或多赢的情况。换句话说,在零和博弈中,博弈双方的利益是对立的,博弈的结果是一方得利必定伴随着另一方的损失,整个博弈的总体价值是恒定不变的。
在这里插入图片描述

3. 纯策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},其中 S 1 = { A 1 , A 2 . A 3 } S_1=\{A_1,A_2.A_3\} S1={A1,A2.A3}, S 2 = { B 1 , B 2 . B 3 } S_2=\{B_1,B_2.B_3\} S2={B1,B2.B3},
A = [ 6 − 1 0 3 1 2 − 3 0 − 1 ] A=\begin{bmatrix} 6 & -1 & 0 \\ 3 & 1 & 2 \\ -3 & 0 & -1 \end{bmatrix} A= 633110021
各局中人应如何选择自己的策略,保证自己在博弈中取得有利的地位。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.博弈论中的最小最大定理

在这里插入图片描述
对于任意一个两个玩家A和B之间的完全信息、零和、有限策略集的博弈,存在一个数V和玩家A的一个策略σ*,使得无论对手B采取何种策略,通过执行σ*,A所能获得的最小收益至少是V。同时,存在玩家B的一个策略τ*,使得当B执行τ*时,即使面对A的最优策略,其给A带来的最大损失也不超过V。

换句话说,A的最小期望得益(即最大损失)等于B的最大期望损失(即最小得益),这个相同的数值就是游戏的值V。A的最优策略是在所有可能的策略中找到那个能够抵御对手任何反击的策略,以确保最坏情况下的最好结果;而B则反过来尝试最大化A的最坏结果,即最小化自己的最大损失。

博弈在纯策略意义下的纳什均衡可以不唯一,博弈的值是唯一的。

5. 混合策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},
其中 S 1 = { A 1 , A 2 , . . . A m } S_1=\{A_1,A_2,...A_m\} S1={A1,A2,...Am},选择每个策略的概率为 X = { x 1 , x 2 , . . . , x m } X=\{x_1,x_2,...,x_m\} X={x1,x2,...,xm};
S 2 = { B 1 , B 2 , . . . , B n } S_2=\{B_1,B_2,...,B_n\} S2={B1,B2,...,Bn},选择每个策略的概率为 Y = { y 1 , y 2 , . . . , y n } Y=\{y_1,y_2,...,y_n\} Y={y1,y2,...,yn}
A = ( a i j ) m × n A=(a_{ij})_{m\times n} A=(aij)m×n
在这里插入图片描述
对于给定的博弈G,
局中人1的所有混合策略构成的集合 S 1 ∗ = { X } S_1^*=\{X\} S1={X}
局中人2的所有混合策略构成的集合 S 2 ∗ = { Y } S_2^*=\{Y\} S2={Y}
期望为 G ∗ = { S 1 ∗ , S 2 ∗ ; E } G^*=\{S_1^*,S_2^*;E\} G={S1,S2;E},为博弈G的混合扩充。

目标
在这里插入图片描述
任何一个给定的二人零和博弈G一定存在混合策略意义下的纳什均衡

6.一个例子

在这里插入图片描述

7.非零和博弈的定义

  • 各方的收益或损失的总和不是零值。
  • 局中人之间不再是完全对立
  • 一个局中人的所得并不一定意味着其他局中人要同样数量的损失
  • 博弈参与方之间可能存在某种共同利益,可以“双赢”或“多赢”

7.1 求解二人非零和博弈混合策略纳什均衡的一般方法

在这里插入图片描述

7.2 反复剔除严格劣策略

在“局中人是理性的”假设前提下,如果一个人的策略集合中存在严格劣策略,理性的他永远不会选择严格劣策略。反复剔除严格劣策略适用于零和博弈与非零和博弈。

  1. 对于局中人1的b策略严格劣与策略d,所以策略b可以删除。
    在这里插入图片描述
  2. 最后可以得到
    在这里插入图片描述

8.奇数定理及其应用

奇数定理:几乎所有的有限策略的博弈都有奇数个纳什均衡,包括纯策略纳什均衡混合策略纳什均衡

简单来说,根据奇数定理,如果一个博弈有两个纯策略纳什均衡,则必定存在至少一个额外的纳什均衡,这导致了纳什均衡的总数是奇数。纳什均衡是指在一个博弈中,没有一个参与者可以通过单独改变自己的策略来改善其结果的稳定策略组合。

需要注意的是,“几乎所有的”这一描述表明并非所有博弈都严格遵循这个规律,但大部分有限博弈确实表现出这样的特性。这个定理对于理解和分析博弈论中的复杂交互行为有着重要意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/292945.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软考 - 系统架构设计师 - 关系模型的完整性规则

前言 关系模型的完整性规则是一组用于确保关系数据库中数据的完整性和一致性的规则。这些规则定义了在关系数据库中如何存储、更新和查询数据,以保证数据的准确性和一致性。 详情 关系模型的完整性规则主要包括以下三类: 实体完整性规则 这是确保每个…

【3D目标检测】Det3d—SE-SSD模型训练(前篇):KITTI数据集训练

SE-SSD模型训练 1 基于Det3d搭建SE-SSD环境2 自定义数据准备2.1 自定义数据集标注2.2 训练数据生成2.3 数据集分割 3 训练KITTI数据集3.1 数据准备3.2 配置修改3.3 模型训练 1 基于Det3d搭建SE-SSD环境 Det3D环境搭建参考:【3D目标检测】环境搭建(OpenP…

企业交换组网之VLAN

1. 企业内网有哪些安全隐患? 2. VLAN如何进行业务隔离?二层VLAN交换 3. 思科华为双厂商VLAN部署区别; --- VLAN - 虚拟局域网 --- 虚拟局域网:通过交换机连接的网络 - 把终端连接在一起 实现内网互通 共享文件夹&#xf…

GIMP - GNU 图像处理程序 - 中文版

GIMP - GNU 图像处理程序 - 中文版 1. Edit -> Preferences -> Interface2. Chinese [zh_CN]3. 重启 GIMP 即可References 1. Edit -> Preferences -> Interface 2. Chinese [zh_CN] 3. 重启 GIMP 即可 References [1] Yongqiang Cheng, https://yongqiang.blog.…

HTML块级元素和内联元素(头部和布局)

目录 1.HTML块级和内联标签: 1.块级元素: 2.内联元素: 3.元素嵌套: 4.元素转换: 示例如下: 2.内联框架: 前言: 示例如下: 3.布局: 4.头部标签: 前言: 说明&…

「MySQL」索引事务

🎇个人主页:Ice_Sugar_7 🎇所属专栏:数据库 🎇欢迎点赞收藏加关注哦! 索引&事务 🍉索引🍌特点🍌通过 SQL 操作索引🍌底层数据结构 🍉事务&…

芒果YOLOv8改进130:Neck篇,即插即用,CCFM重构跨尺度特征融合模块,构建CCFM模块,助力小目标检测涨点

芒果专栏 基于 CCFM 的改进结构,改进源码教程 | 详情如下🥇 💡本博客 改进源代码改进 适用于 YOLOv8 按步骤操作运行改进后的代码即可 即插即用 结构。博客 包括改进所需的 核心结构代码 文件 YOLOv8改进专栏完整目录链接:👉 芒果YOLOv8深度改进教程 | 🔥 订阅一个…

微服务(基础篇-006-Docker安装-CentOS7)

目录 05-初识Docker-Docker的安装_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV1LQ4y127n4?p46&spm_id_frompageDriver&vd_source60a35a11f813c6dff0b76089e5e138cc 0.安装Docker 1.CentOS安装Docker 1.1.卸载(可选) 1.2.安装dock…

UE5启用SteamOSS流程

一、安装OnlineSubsystemSteam插件 1、在UE里安装OnlineSubsystemSteam 2、设置默认开始地图 3、设置DefaultEngine.ini文件: 打开项目根目录/Config/DefaultEngine.ini文件 打开官网的配置说明 复制并粘贴到该文件中 4、设置运行模式 5、测试 确保Steam平台已…

electron打包桌面版.exe之vue项目踩坑(vue3+electron 解决打包后首页打开空白,打包后路由不跳转及请求不到后端数据等问题)

vue项目https://www.qingplus.cn/components-web/index打包桌面版问题集合 一、静态资源加载问题 npm run electron_dev桌面版运行后页面空白,内容未加载。 填坑: 打包配置要用相对路径 vite.config.ts文件中的base要改成./,之前加了项目…

postcss安装和使用(详细)

1,安装postcss: 在此之前需要安装有node.js 第一步 命令:cnpm install postcss-cli -g 第二步 命令:cnpm install postcss –g 推荐内容 2,下载autoprefixer插件,并创建postcss.config.js文件并写入配置代码 autoprefixer插件…

习题2-5 求平方根序列前N项和

本题要求编写程序,计算平方根序列 的前N项之和。可包含头文件math.h,并调用sqrt函数求平方根。 输入格式: 输入在一行中给出一个正整数N。 输出格式: 在一行中按照“sum S”的格式输出部分和的值S,精确到小数点后两位。题目保证计算结果不…

西南交大swjtu算法实验3.3|穷举法

1.实验目的 通过具体例子学习排列这种典型的穷举算法的求解过程以及程序框架,分析其算法的求解过程,以及如何设计穷举法解决实际问题。通过本实验,理解穷举法的特点以及实际应用中的局限性。 2.实验任务 有n (n>1)个任务需要…

HarmonyOS 应用开发之FA模型与Stage模型应用组件

应用配置文件概述(FA模型) 每个应用项目必须在项目的代码目录下加入配置文件,这些配置文件会向编译工具、操作系统和应用市场提供描述应用的基本信息。 应用配置文件需申明以下内容: 应用的软件Bundle名称,应用的开发…

使用Python实现对word的批量操作

Python在平时写写小工具真是方便快捷,Pyhon大法好。以下所有代码都是找了好多网上的大佬分享的代码按照自己的需求改的。 调用的库为Python-docx、win32com、PyPDF2、xlwings(操作excel)。 因为公司的任务要对上千个word文件进行批量操作&a…

JAVAEE之网络编程

1.网络编程 网络编程,指网络上的主机,通过不同的进程,以编程的方式实现网络通信(或称为网络数据传输)。 当然,我们只要满足进程不同就行; 所以即便是同一个主机,只要是不同进程&am…

【论文阅读】ELA: Efficient Local Attention for Deep Convolutional Neural Networks

(ELA)Efficient Local Attention for Deep Convolutional Neural Networks 论文链接:ELA: Efficient Local Attention for Deep Convolutional Neural Networks (arxiv.org) 作者:Wei Xu, Yi Wan 单位:兰州大学信息…

C语言-文件操作

🌈很高兴可以来阅读我的博客!🌟我热衷于分享🖊学习经验,🏫多彩生活,精彩足球赛事⚽🔗我的CSDN: Kevin ’ s blog📂专栏收录:C预言 1. 文件的作用 …

基于spark的大数据分析预测地震受灾情况的系统设计

基于spark的大数据分析预测地震受灾情况的系统设计 在本篇博客中,我们将介绍如何使用Apache Spark框架进行地震受灾情况的预测。我们将结合数据分析、特征工程、模型训练和评估等步骤,最终建立一个预测模型来预测地震造成的破坏程度,同时使用可视化大屏的方式展示数据的分布…

docker-compose运行springinitializr用来创建springboot2

前言 spring initializr官方的地址是: https://start.spring.io/ ,这是一个用来创建springboot脚手架的一个工具,但是目前这个工具已经更新到springboot3,而我还没学springboot3,目前还想继续创建springboot2,我就想能…