小偷-守卫博弈:“诡异”的纳什均衡

目录

1.什么是小偷-守卫博弈?

2.用数学刻画博弈信息

3.我是小偷!

4.我是守卫!

5.尬住了。。。

6.一个感性的认识(给参数赋些值)

7.纯策略?混合策略!

8.混合策略纳什均衡求解

9.结论!!!

10.基于现实的思考

11.总结


1.什么是小偷-守卫博弈?

        在博弈论中,有一个经典例题,叫做小偷-守卫博弈。

        小偷-守卫博弈题目简明,但从中得出的结论足以让人思考良久。

题干如下:


2.用数学刻画博弈信息

        题干貌似很清晰简明,也很贴近生活,但是怎么去分析它呢,总不能“语文建模吧”(狗头)。我们可以尝试用图表把上面的信息刻画出来。

        这里所说的图表,就是博弈论中特指的“支付矩阵”,它刻画了各个博弈人采取不同策略时对应的收益情况,通常是处理博弈问题的第一步。不过要注意,支付矩阵只可以表示有限博弈。(有限博弈:博弈人数量有限、策略总数有限)

        小偷-守卫博弈是最简单的二人有限博弈,故可以很轻松地列出支付矩阵:

        列出支付矩阵后,需要说明的是,在每一个小方格中,左侧的值代表小偷的收益,右侧的值代表守卫的收益。四个小方格也就代表了小偷和守卫共四个不同的策略组合。

        现在一共有4个参数,大小关系未知:V,D,A,S(均为正数)。

        接下来进入角色分析环节了。


3.我是小偷!

        假设你作为小偷,一个很简单的问题摆在你面前:偷还是不偷?

        在思考这个问题之前,有必要先了解“严格优势策略 / 弱优势策略”的概念。

        严格优势策略:不管其他局中人选择什么策略,一个参与人选择他的某个策略给他带来的支付均高于他选择任何其他策略。

        弱优势策略:不管其他局中人选择什么策略,一个参与人选择他的某个策略给他带来的支付均不低于他选择任何其他策略。

以最为经典的二人有限博弈——囚徒困境优势策略分析示例:

对于囚徒B来说:

        如果选择坦白,他的收益向量是 u1 = [ -8  ,  0  ];

        如果选择抵赖,他的收益向量是 u2 = [ -10 , -1 ];

        因为 -8 > -10 , 0 > -1 ,所以 u1 > u2 严格成立。

        也就是对于囚徒B来说,u1的收益严格高于u2,即u1为囚徒B的严格优势策略。

        (除非囚徒B脑子有bug,否则没有任何理由不选择“坦白”策略)

对于囚徒A来说同理。

        故囚徒困境存在一个严格优势策略均衡:(坦白,坦白)。


        现在回到最初的小偷-守卫博弈,你变成了一个会思考、有理智的小偷。

        按照优势策略均衡的思考方式,你应该能想到以下几点:

①如果我选择偷窃,我的收益向量是 u1 = [ V , -A ];

②如果我选择不偷,我的收益向量是 u2 = [ 0 ,   0 ];

③因为 V > 0 , -A < 0 ,所以一定不可能存在 u1 > u2 或者 u1 > u2 的情况。

④也就是对于我来说,在“偷”与“不偷”之间,不存在优势策略。


4.我是守卫!

        换位思考以下,假设你变成了一个会思考、有理智的守卫

        按照优势策略均衡的思考方式,你同样能想到以下几点:

①如果我选择睡觉,我的收益向量是 u1 = [ -D , S ];

②如果我选择不睡,我的收益向量是 u2 = [  0 ,  0 ];

③因为 -D < 0 , S > 0 ,所以一定不可能存在 u1 > u2 或者 u1 > u2 的情况。

④也就是对于我来说,在“睡”与“不睡”之间,不存在优势策略。


5.尬住了。。。

        与囚徒困境博弈不同,小偷-守卫博弈中的两个局中人都没有优势策略可言,即不存在优势策略均衡。

        但不管你是小偷还是守卫,事件该发生的还是要发生,你仍然需要在限定时间内给出你的选择……

        那怎么办?

        抛硬币?以1/2,1/2的概率随机作出你的选择?

        还是凭自己的喜好(感性地)选择一个策略?

(可能你是一个喜欢上班摸鱼的守卫)

        ……

        当然,事情没有那么简单。


6.一个感性的认识(给参数赋些值)

        假设你依旧是那个聪明理智的小偷,当你看到下面两个支付矩阵时会有什么想法?

支付矩阵1:

支付矩阵2: 

         

        通过对比,你的感性告诉你,你将在第2个博弈场景中大有所为——因为你对多出来的4000个单位的收益充满欲望。换句话说,你认为你更有可能在第2个博弈场景中选择偷窃行为。

        但是如果你足够聪明,你的理性会告诉你,偷窃利益的增长会引起守卫的警觉。

        守卫在第2个博弈场景中睡觉的可能性明显会小于在第1个场景中睡觉的可能性,因为理智的守卫不可能在看到偷窃利益增长的变化后毫无反应和行动。

        这样一来,你好像连这两个对比博弈场景都分析不清了……


        但是,你能明显感觉到,总有一种神奇的力量在控制这个博弈的结果,制约着局中人的策略。

        这种神奇的力量叫“纳什均衡”。


        那么小偷-守卫博弈存在纳什均衡吗?

        不存在,但又存在。


7.纯策略?混合策略!

       

        小偷-守卫博弈不存在优势策略均衡,并且也不存在纯策略纳什均衡。

        但是,如果你的策略并非纯策略,而是混合策略呢?

         小偷以一定的概率p选择偷窃,守卫以一定的概率q选择睡觉,则存在一对特殊p*,q*,使得双方都不愿意独自偏离自己所选定的策略,从而达到(p*,q*)的混合策略纳什均衡。


8.混合策略纳什均衡求解


小偷(p)的期望收益U1(p,q):

期望收益U1(p,q)对p求偏导数:

q*为候选解


守卫(q)的期望收益U2(p,q):

期望收益U2(p,q)对q求偏导数:

p*为候选解:


9.结论!!!

        经过验证,p*、q*均为该博弈的混合策略纳什均衡解。

        还记得这个博弈中的4个参数吗:

①V:小偷盗窃成功的收益

②D:守卫失职所造成的损失

③A:小偷被逮捕的损失

④S:守卫睡觉且无事发生的收益

假定:V(偷窃收益)    和    S(睡觉收益)        为不可变参数;

           A(对小偷的惩罚)和 D(对守卫的惩罚)为可变参数。


你应该可以得出以下结论:

        让人感到诡异的是:加大对小偷的处罚,不仅无法降低偷窃事件的发生率,反倒会使守卫偷懒的概率增加;加大对守卫的处罚,不会降低守卫偷懒的概率,但是却能使偷窃事件的发生率下降!

<摘自:倪玉平.“激励的悖论”——试论清代的盐业缉私[J].盐业史研究,2006(04):3-7.>


10.基于现实的思考

        基于“小偷-守卫博弈”的现实场景和理论模型还是有较大差别的,如在监考人员履职的例子中,不能强行套用模型结论,认为加大对学生作弊的处罚有害而无利,这于我们的直觉和人类社会的基本规律相违背。

        造成这种现象的原因可以归纳为以下几点:

①现实场景并不是理想的两人(监考人员、考生)博弈,有国家调控和干预

(监考人员的责任感并不会因为考生选择策略的不同而发生显著的变化)

②局中人并不是绝对理性的,存在心理威慑效应

(加大对局中人犯错的处罚可以明显地改变其策略的偏向程度)

③人类社会伦理需要

(社会伦理与良知不允许政府的政策纵容错误事件的发生)

        因此,这两种调控手段需要双管齐下,才能达到预期的效果。这是符合博弈理论的,也是符合社会伦理道德的。

ps:我在寒假发过一篇教育法治的文章,涉及到学生考试作弊的处罚问题。

(关键词:高校、学位、学术自治、刑法)

链接:案例分析(第4期)


11.总结

        小偷-守卫博弈在双方采用纯策略的情况下不存在纳什均衡,但在双方采用混合策略的情况下存在纳什均衡,且双方都没有动机偏离该纳什均衡。

        从结果上看,“加大对小偷的处罚,无法降低偷窃事件的发生率,反倒会使守卫偷懒的概率增加”和“加大对守卫的处罚,不会降低守卫偷懒的概率,但是却能使偷窃事件的发生率下降”这两个结论在理论层面反映了“激励悖论”存在的真实性,给生活中的许多问题提供了可参考的指导思想。

        但是真实场景中环境的复杂性也使得博弈原理更为复杂,需要兼顾多方面的影响,而且要考虑人的感性因素

        小偷-守卫博弈是一个简单的问题,也将一直是博弈论中永恒的经典,并不断给人类带来感性的挑战和理性的思考。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/70829.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++实现U盘小偷(超详细版)

文章目录 前言一、程序演示二、项目下载三、源代码四、代码解析1.main函数2.RegisterGlobalKey与UnRegistreGlobalKey函数3.DealMsg函数4.FindDriver函数5.ThrToSearch线程搜索函数6.ThrToCopy线程拷贝函数7.FindAllFile函数 前言 对于C/C学习感兴趣的小伙伴&#xff0c;可以看…

一个简单的动态规划问题---小偷案例

Java算法训练—小偷案例 文章目录 Java算法训练---小偷案例 前言一、案例描述二、问题分析三、代码示例总结 前言 动态规划是一种算法技巧&#xff0c;先举一个例子&#xff1a;   如何让一个四岁的小孩理解动态规划的思路&#xff1f;国外友人有这样一个例子&#xff1a;列…

Python编程判断谁是小偷

谁是小偷 ‎小区发生盗窃案&#xff0c;有四个人嫌疑最大&#xff0c;警察找来讯问。‌ ‎A说&#xff1a;不是我。‌ ‎B说&#xff1a;是C。‌ ‎C说&#xff1a;是D。‌ ‎D说&#xff1a;他冤枉人。‌ ‎四人中有一人说了假话&#xff0c;编程分析谁是小偷。 此题主要…

焦耳小偷工作原理分析

当开关闭合&#xff0c;Q1获得基极电流导通&#xff0c;右侧线圈流过电流&#xff0c;由于同名端的关系其在左侧线圈产生的互感电动势上负下正&#xff0c;正反馈使得Q1迅速饱和导通。右侧电流处于饱和状态&#xff0c;感应电动势消失&#xff0c;互感电动势也消失。互感电动势…

c语言四个人中有一个人是小偷,、甲,乙,丙,丁四个人中有一个人是小偷,请根据四个人的谈话判断谁是小偷?已知四个人中有一个人说假话...

、甲,乙,丙,丁四个人中有一个人是小偷,请根据四个人的谈话判断谁是小偷?已知四个人中有一个人说假话 关注:65 答案:5 mip版 解决时间 2021-01-31 07:52 提问者酒瘾渼亽兒 2021-01-30 16:58 、甲,乙,丙,丁四个人中有一个人是小偷,请根据四个人的谈话判断谁是小偷?已…

推理题-谁是小偷?

警察抓住了A、B、C、D四名盗窃嫌疑犯&#xff0c;其中只有一人是小偷。在审问时&#xff0c; A说&#xff1a;“我不是小偷”&#xff1b; B说&#xff1a;“C是小偷”&#xff1b; C说&#xff1a;“小偷肯定是D”&#xff1b; D说&#xff1a;“C在冤枉好人”。 现在已经…

饥荒联机版专用服务器怎么修改小偷包,饥荒联机小偷背包代码 | 手游网游页游攻略大全...

发布时间&#xff1a;2016-08-14 饥荒海难小偷背包获得方法?饥荒失落之船刷小偷背包图文教程,饥荒海难里的小偷背包是格子最多的背包了,相信很多玩家都想拥有,但是小偷背包却不是那么好拿的,今天小编就为大家带来一套饥荒海难刷小偷背包图文教程,希望对大家有所帮助 ... 标签&…

【Multisim仿真】焦耳小偷电路仿真实验

【Multisim仿真】焦耳小偷电路仿真实验 Multisim仿真 本实验仿真平台&#xff1a;Multisim14 基本电路 仿真前的相关设置选项 变压器参数设置主副线圈绕组比例调整比例&#xff1a;10:10 铁芯设置选项&#xff1a; ###对变压器输出绕组端的电压进行瞬态电压进行捕捉 设置…

深度优先遍历算法-01小偷偷东西问题

小偷偷东西问题 前言 深度优先遍历是经典的图论算法&#xff0c;深度优先遍历算法的搜索逻辑和它的名字一样&#xff0c;只要有可能&#xff0c;就尽量深入搜索&#xff0c;直到找到答案&#xff0c;或者尝试了所有可能后确定没有解。简单来说&#xff0c;深度优先遍历就是按照…

百家云在人工智能领域再有新动作,发布应用于多个行业的AIGC解决方案

4月17日消息&#xff0c;音视频SaaS上市公司百家云&#xff08;股票代码&#xff1a;RTC&#xff09;今日宣布&#xff0c;公司将正式推出应用于多个垂直行业及场景的人工智能生成内容及视频解决方案。 百家云总裁马义表示&#xff0c;此次发布的解决方案&#xff0c;将在极短…

可以远程连接服务器,但是无法ping通问题

右键电脑&#xff0c;找到管理 在服务器管理里找到配置项 在配置项里找到 高级安全windows防火墙 在高级安全windows防火墙里&#xff0c;找到&#xff0c;按如下图示&#xff0c;找到“文件和打印机共享&#xff08;回显请求-ICMPv4-in&#xff09;双击。此时图片状态默…

解决连接vcenter (客户端无法向服务器发送完整的请求。(基础连接已经关闭:发送时发生错误。)) 问题...

vCenter版本 5.5 vCenter 安装在server 2008 r2上面&#xff0c;今天补丁一打&#xff0c;重启后就无法连接vcenter了&#xff0c;起初以为是补丁的问题导致vcenter工作不正常&#xff0c;卸载了补丁依旧无法正常连接。 报未知连接错误&#xff0c;&#xff08;客户端无法向服务…

微信提示已连接到服务器失败,微信提示无法连接到服务器如何解决

近来发现不少网友对于微信提示无法连接到服务器如何解决这方面的讯息关注的热度颇高的&#xff0c;那么小编今天就针对此微信提示无法连接到服务器如何解决收集了一些相关的讯息 希望小编收集的这些讯息 能帮助到你。 1、更换接入点,重新连接网络&#xff1a; 2、单击手机上的M…

新手安装postgreSQL后无法连接服务器

2019独角兽企业重金招聘Python工程师标准>>> 系统&#xff1a;Linux Deepin 15.1 postgreSQL&#xff1a;9.5.1 pgAdmin Ⅲ&#xff1a;1.22.0 使用新立得安装postgreSQL和pgAdminⅢ之后&#xff0c;打开pgAdmin需新建服务器。 打开新建服务器窗口后&#xff0c;名称…

用云服务器架设好服务器显示无法连接

各位论坛的前辈大家好&#xff0c;我是刚进入这个圈子的小白&#xff0c;曾经这个问题困扰我两天时间&#xff0c;找了好多教程&#xff0c;都不是我想要的&#xff0c;我一度以为是我传奇版本的问题&#xff0c;所以后面解决掉之后&#xff0c;出个帖子给大家分享下&#xff1…

使用telnet命令,报错:无法打开主机的连接在端口23连接失败

1.页面载入出错时&#xff0c;查找问题的方法 当访问某个页面时&#xff0c;出现如下情况&#xff1a; 遇到以上情况&#xff0c;可以先通过以下的方式确认网络是否连接上 &#xff08;1&#xff09;打开cmd&#xff0c;输入命令&#xff1a;ping <ip> &#xff08;2&…

标题: 连接到服务器------------------------------无法连接到 (local)。------------------------------其他信息:在与

标题: 连接到服务器------------------------------无法连接到 (local)。------------------------------其他信息:在与 在使用SQL Server的时候无法连接的错误&#xff0c;可以参照下图 我这个问题的解决方法就是将服务器名称改一下&#xff0c;删掉原来的服务器名称栏的东西…

手机总显示连接不到聊天服务器,连接不到聊天服务器

连接不到聊天服务器 内容精选 换一换 访问CloudTable的HBase连接不上&#xff0c;出现如下所示的错误信息&#xff1a;出现该问题的可能原因为&#xff1a;网络访问不通。由于CloudTable的链接地址是内网地址&#xff0c;不是公网地址&#xff0c;不能在公网环境直接连接CloudT…

[SQL Server无法连接到服务器]标题: 连接到服务器 --------- 无法连接到 ****

标题: 连接到服务器 ---------- 无法连接到 **** 现象&#xff1a; 电脑安装好SQL可以用&#xff0c;之后&#xff08;过了几天&#xff0c;或者不久&#xff09;就出现如题错误&#xff0c;无法连接。因为此问题笔者也已重装过多次该软件…… 原因&#xff1a; 每次SQL Serve…

计算机科学研究课题申报书,教育科学研究课题立项申请书范文

教育科学研究课题立项申请书范文 分类&#xff1a;课题研究 发表时间&#xff1a;2020-04-17 16:23 教育科学研究课题立项申请书范文 教育科学研究课题立项申请书&#xff0c;都有规定的表格的&#xff0c;你需要向哪个课题管理部门递交&#xff0c;就需要向谁索要&#xff0c;…