张维迎《博弈与社会》威胁与承诺(1)威胁的可信与不可信

动态博弈的描述

前两章分析的博弈中,所有参与人都同时行动,这样的博弈被称为静态博弈。这一章我们开始关注动态博弈。不同于静态博弈,动态博弈中的参与人行动有先后顺序,后行动者在先行动者做出决策之后再选择自己的行动。生活中大部分博弈属于动态博弈。比如,下棋时,一方先走,另一方后走;买东西时消费者和商家的讨价还价,一方先出价,另一方再还价;谈婚论嫁,一方求婚,另一方决定是否应允。企业之间的价格战往往也是以动态方式进行,一方先降价,另一方再跟进。

由于动态博弈行动有先后顺序,在描述动态博弈时,需要把参与人行动的顺序刻画出来,所以,博弈论中常用博弈树(game tree)描述动态博弈,如下图所示:

这个博弈可以理解为市场进入博弈(设想为一个规模不大的市场,只能有一个企业可持续生存)。图中空心圆圈表示初始决策点,实心点表示之后的决策点,从决策点后引申的直线叫做路径(path),代表参与人在特定时点上的行动。参与人(企业)A首先选择“进入”或“不进入”; A选择后B再做选择。假如A首先选择进入,如果B同样选择进入,则两人得到的收益都为-1;如果B选择不进入,则A得到1, B得到0。假如A选择不进入,如果B选择进入,则A、B得到的收益分别为0和1;如果B也选择不进入,则各自得到0。习惯上,在博弈树最后的支付组合中,第一个数字表示第一个采取行动的人的收益,第二个数字表示第二个采取行动的人的收益(三人及三人以上的博弈以此类推)。

用博弈树的方法来描述动态博弈可以很直观地表明参与人的行动顺序、信息和收益。不足之处在于,博弈树无法直接表明参与人的战略,需要我们根据行动和信息等条件来确定

作为行动计划的战略

在静态博弈里,战略和行动是一样的。但在动态博弈里,参与人的决策是在不同时点做出的,因而战略并不一定是单一的行动,而是一个完备的行动计划,要为参与人在每个时点上规定一个行动。比如在上述博弈中,A首先行动,他的决策不可能建立在B行动的基础上,所以其战略是进入或者不进入,但B不一样:B后行动,他可以根据A的选择制定自己的行动计划。这样的话,由于A有两个不同选择,B依据A的每一个选择又具有两个不同的选择,从而B总共有4个战略:

战略1:无论A进入还是不进入,B都选择进入;

战略2:如果A进入,则B不进入;如果A不进入,则B进入;

战略3:如果A进入,则B进入;如果A不进入,则B也不进入;

战略4:无论A进入还是不进入,B都选择不进入。

对于B来说,上述的4个战略相当于4个行动计划。他需要在博弈开始之前为自己确定一个行动计划。假如B宣称自己将会选择战略1,即“无论A进入还是不进入,B都选择进入”,这时A将如何选择?

如果A相信B真的选择这一战略的话,自己选择进入,就会得到-1,而如果自己不进入可以得到0,因此A的最优选择是不进入。实际上,A选择不进入和B选择战略1构成了一个纳什均衡,因为:给定A不进入,B的战略也是最优的;给定B的战略,A不进入是最优的。但问题是B的声明可信吗

静态博弈中,参与人一旦选定战略(行动)后,就不会改变了。但是,在动态博弈中,参与人在博弈开始前选择的战略(行动计划)可能在博弈开始后进行调整,不一定按照原定的战略(行动计划)来进行。也就是说,事前最优的战略在事中或事后不一定是最优的。在本例中,B在事前声称要选择战略“不管A进入不进入,自己都选择进入”,但一旦A没有理会这一声明,选择了“进入”,此时B就会发现选择原来的战略并不是最优的,因为如果他此时改为选择“不进入”可以得到0,而坚持原定战略会得到-1。这说明B声明自己会选择战略1并不可信。

生活中,这种声明可能是“威胁性”的(threat),类似“如果你不答应做某事,我就会如何”,也可能是“许诺性”的(promise),类似“如果你答应做某事,我会如何”。其实“威胁性”声明可以变成“许诺性”声明,比如,“如果你不答应做某事,我就会如何”可以改变为“如果你答应不做某事,我会如何”。一个例子是,家长管教孩子,可以威胁性地说,“如果你不答应放弃玩游戏,我要扣除你这个月的零花钱”;也可以许诺性地说,“如果你答应放弃玩游戏,我就不扣除你这个月的零花钱”。同样,许诺性的声明也可以变成威胁性的声明。这样,从分析的角度来看,就没有必要对威胁性声明和许诺性声明加以区分了。其实质都是发出声明的一方希望以此来影响对方的行动。因此,下文我们就把这些声明统称为“威胁”

威胁的可信性

“威胁”是现实生活中经常遇到的问题。比如,员工可能扬言,如果不给加薪就报复上司;热恋中的女子可能威胁说,如果男方与她分手,她就不再活下去;存在领土争议的国家可能宣称,如果对方不让步,就诉诸武力,等等。

当博弈的一方发出威胁,接到威胁的一方就需要判断这一威胁是否可信。如前述分析,这一威胁可信性问题的根源是动态博弈中事前最优和事后最优的不一致性。而适用于静态博弈的解概念——纳什均衡并没有考虑这种动态不一致性。因此,当我们用纳什均衡概念来求解动态博弈时,有可能会出现包含不可置信威胁(non-credible threat)的纳什均衡。

下面我们通过分析学校里的师生博弈来说明这一问题。学校设计的课程是为了给学生传授知识,考试的目的是通过评价学生的成绩督促学生认真学习。出于职业道德和声誉的考虑,老师一般会根据学生答题的情况给出公平的分数,如及格还是不及格。但无论实际考得如何,学生都希望老师给个好成绩,至少及格,因为考试成绩关系到学生的利益,包括能不能顺利毕业,以及能否找到满意的工作。现假定有一个学生平时没有好好学习,期末考试考得不好,到不了60分。他去找老师希望老师能够让他及格。因此,我们有如下的师生博弈:

老师先行动,他的战略是判卷时给学生及格或不及格;学生后行动,他的战略是依据老师所给他的成绩来决定自己是欣然接受这一成绩还是要报复老师。所谓欣然接受是指认可老师给出的分数;所谓报复老师是指对老师采取一些人身或名誉伤害的行动。

具体来说,学生会有4个战略可选择:

战略1:如果老师给及格,则欣然接受;如果给不及格,则报复老师。

战略2:如果老师给及格,则报复老师;如果给不及格,则欣然接受。

战略3:不管老师是否给及格,都欣然接受。

战略4:不管老师是否给及格,都报复老师。

双方的收益情况是:如果老师违心给了学生及格,学生没有报复他,他的收益为-1,学生的收益为1;如果他违心给了学生及格,但学生还是报复了他,则他的收益为-10,此时学生也因为报复老师被学校处分,收益也为-10;如果老师秉公给了学生不及格,学生报复,则老师为-10,学生也为-10;如果老师秉公给了学生不及格,学生接受,则老师收益为1,学生为-1。

可以将学生上述的4种策略相应地简记为(接受,报复)、(报复,接受)、(接受,接受)、(报复,报复)。这里,(接受,报复)读为:如果老师给及格,就接受;如果老师给不及格,就报复。类似地,(报复,接受)、(接受,接受)、(报复,报复)可以做相应的解读。这样,我们就可以把上述博弈用下图所示的战略式(即标准式)来描述。

通过划线法求解这个博弈的纳什均衡,可以发现共有三个纳什均衡:

第一个纳什均衡是“老师选择及格,学生选择(接受,报复)”。均衡结果是:老师选择及格,学生不报复;双方的收益为:老师-1,学生1。意思是,学生前来找老师时声称自己将选择(接受,报复),即老师给及格就接受,不给及格就报复。老师担心自己会报复,违心地打了及格,故收益为-1。而学生呢,本来自己不会及格,现在及格了,故收益为1。这一纳什均衡隐含着老师屈从学生的威胁。但学生如果真的报复老师的话,又会遭受学校更为严厉的处罚,使得他的收益成为-10。因此,如果学生理性的话,应不会选择报复。进一步,如果老师知道学生是理性的,就不应该相信其威胁。所以,这一纳什均衡尽管满足互为最优,但却包含了一个不可置信(non-creditable)的威胁。

第二个纳什均衡是“老师选择不及格,学生选择(报复,接受)”。均衡结果是:老师选择不及格,学生不报复;双方的收益为:老师1,学生-1。直观含义是,学生声称老师给及格就报复,不给及格就接受,而老师则该给不及格就给了不及格。老师因为公正评分,得到的收益为1,而学生选择接受,得到不及格的结果,收益为-1。但这一纳什均衡中,学生的战略(报复,接受)要求在老师给及格的情况下选择报复,但报复又会让其得到-10的收益。所以,这其实也是一个不可置信的威胁。

第三个纳什均衡是“老师选择不及格,学生选择(接受,接受)”。均衡结果是:老师选择不及格,学生接受;双方的收益为:老师1,学生-1。意思是,学生的态度很端正,不管老师给不给及格,自己都能接受,老师则实事求是,该给不及格就给了不及格。老师因为公正评分,得到的收益为1,而学生选择接受,得到不及格的结果,收益为-1。这个纳什均衡比较合理,没有包含不可置信的威胁在里面。

上述三个纳什均衡中的前两个都包含了不可置信的威胁。为什么这两个纳什均衡会包含不可置信的威胁或者说不合理的战略呢?这是因为动态博弈中会出现动态不一致性:事先最优战略和事后最优战略会不一样。学生事先宣布其要采取的战略(比如“及格则接受,不及格就报复”等),从事后看可能并不是最优,因为如果老师真的判了不及格(或及格),学生的最优选择是接受。因而这样的威胁是不可信的。这就意味着,我们不能简单地把纳什均衡应用到动态博弈中。动态博弈需要能够反映动态一致性、排除不可置信威胁的均衡概念。因此,我们需要对原来的纳什均衡概念进行改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/250667.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

分类预测 | Matlab实现GAF-PCNN-MATT格拉姆角场和双通道PCNN融合多头注意力机制的分类预测/故障识别

分类预测 | Matlab实现GAF-PCNN-MATT格拉姆角场和双通道PCNN融合多头注意力机制的分类预测/故障识别 目录 分类预测 | Matlab实现GAF-PCNN-MATT格拉姆角场和双通道PCNN融合多头注意力机制的分类预测/故障识别分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Matlab实现G…

【开源】基于JAVA+Vue+SpringBoot的陕西非物质文化遗产网站

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 设计目标2.2 研究内容2.3 研究方法与过程2.3.1 系统设计2.3.2 查阅文献2.3.3 网站分析2.3.4 网站设计2.3.5 网站实现2.3.6 系统测试与效果分析 三、系统展示四、核心代码4.1 查询民间文学4.2 查询传统音乐4.3 增改传统舞…

springboot整合rabbitmq,及各类型交换机详解

RabbitMQ交换机: 一.交换机的作用 如果直接发送信息给一条队列,而这一消息需要多个队列的的多个消费者共同执行,可此时只会有一个队列的一个消费者接收该消息并处理,其他队列的消费者无法获取消息并执行。所以此时就需要交换机接…

IDEA中的Run Dashboard

Run Dashboard是IntelliJ IDEA中的工具【也就是View中的Services】,提供一个可视化界面,用于管理控制应用程序的运行和调试过程。 在Run DashBoard中,可以看到所有的运行配置,以及每个配置的运行状态(正在运行&#xf…

Qt+css绘制标题

之前学过html和小程序,帮老师做项目的时候也用过vue,在想qt绘制界面是不是也可以使用css,然后查了一些资料,绘制了一个标题,准备用到智能家居的上位机上面。 成果 源码 重写了paintEvent函数和TimeEvent函数,一个用于绘…

centos7安装oracle

1 安装虚拟机 设置4G内存,硬盘40G 2 配置网络环境 2.1配置主机名 # vi /etc/hostname 修改为 oracle2.2 配置IP地址 # vi /etc/sysconfig/network-scripts/ifcfg-ens33 修改 BOOTPROTO"static" ONBOOT"yes" IPADDR192.168.109.110 NETMAS…

MySQL学习记录——일 MySQL 安装、配置

文章目录 1、卸载内置环境2、安装MySQL3、启动4、登录5、配置my.cnf 当前环境是1核2G云服务器,CentOS7.6。要在root用户下进行操作 1、卸载内置环境 云服务器中有可能会自带mysql还有mariadb这样的数据库服务,在安装我们mysql前,得先查找一下…

composer常用命令

查看全局配置信息 composer config -gl 设置镜全局像地址 composer config -g repo.packagist composer https://mirrors.aliyun.com/composer/ 去掉-g,即表示只有当前项目使用该镜像 批量安装composer项目依赖 composer install 执行该命令后,会读取当…

K8S部署Harbor(三部曲之三:使用)

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

mysql升级到8.x

1.下载和安装 1.1.下载 mysql下载地址: https://dev.mysql.com/downloads/mysql/5.5.html?os31&version5.1 应该下载这个类似版本 mysql-8.0.36-linux-glibc2.17-x86_64-minimal.tar.xz 1.2 安装 解压: tar xvf mysql-8.0.36-linux-glibc2.17…

Android之命令行烧写OTA镜像(一百八十五)

简介: CSDN博客专家,专注Android/Linux系统,分享多mic语音方案、音视频、编解码等技术,与大家一起成长! 优质专栏:Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏:多媒…

IDEA:git 回滚本地提交-git 选择 Reset Current Branch to

前言 回滚提交到本地但是还没有 Push 上去的提交 选择我们要回滚的节点,然后点击 git 选择 Reset Current Branch to… 再选择 Hard 。当我们点击 Reset 的时候,代码就会回滚到单前选中的这个版本

django+flask警务案件信息管理系统python-5dg53-vue

1)用户在后台页面各种操作可及时得到反馈。 (2)该平台是提供给多个用户使用的平台,警员使用之前需要注册登录。登录验证后,警员才可进行各种操作[10]。 (3)管理员用户拥有信息新增,修…

D2025——双通道音频功率放大电路,外接元件少, 通道分离性好,3V 的低压下可正常使用

D2025 为立体声音频功率放大集成电路,适用于各类袖珍或便携式立体声 收录机中作功率放放大器。 D2025 采用 DIP16 封装形式。 主要特点:  适用于立体声或 BTL 工作模式  外接元件少  通道分离性好  电源电压范围宽(3V~12V…

【gcc】webrtc发送侧计算 丢包率

大神的分析 : 提到: 每当收到cc-feedback或者收到RR-report的时候就能统计出丢包率,在cc-controller中就会调用SendSideBandwidthEstimation::UpdatePacketsLost()去更新丢包率,同时进行码率预估 G:\CDN\rtcCli\m98\src\modules\congestion_controller\goog_cc\send_side_b…

QT线程 (8)

QT的线程 文章目录 QT的线程1、为什么要用线程?2、QT线程1. QT4线程1. QT5线程![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/2a9e78f4a64b47f9b516bb02331e9022.png)3. QT5线程的退出4. connect的第五个参数1. 直接方式2. 队列方式 3、QT线程绘制QIma…

自然语言处理--概率最大中文分词

自然语言处理附加作业--概率最大中文分词 一、理论描述 中文分词是指将中文句子或文本按照语义和语法规则进行切分成词语的过程。在中文语言中,词语之间没有明显的空格或标点符号来分隔,因此需要通过分词工具或算法来实现对中文文本的分词处理。分词的…

调试以及发布npm组件

开发原因: 由于公司自己的封装到npm的组件有点问题,负责人由在忙其他,就由我去负责改改,中途出了不少问题,记录一下。 一、下载源码 第一步肯定是去git上把组件的源码下载下来,这一步没什么好说&#xf…

分布式事务 seata+nacos 部署

分布式事务 seatanacos 部署 一、下载seata二、解压配置三、导入数据库四、nacos配置五、配置要引入事务的模块的配置文件六、启动七、测试 这里使用的版本: nacos:2.0.4 seata:1.5.2 seata官方地址:https://seata.apache.org/zh-…

LabVIEW汽车自燃监测预警系统

LabVIEW汽车自燃监测预警系统 随着汽车行业的飞速发展,汽车安全问题日益受到公众的关注。其中,汽车自燃现象因其突发性和破坏性,成为一个不可忽视的安全隐患。为了有效预防和减少自燃事故的发生,提出了LabVIEW的汽车自燃监测预警…