专业学习|博弈论-课程沿革

学习来源:北京大学刘霖《博弈论》MOOC公开课
备注:仅做学习分享,请勿转载,转载必究!

(一)博弈论的预备知识

        基本的微积分的知识和概率论的知识。简单的说会求导数,会求简单的积分,知道概率分布的含义、几种简单的概率分布,会求数学期望,了解贝叶斯法则。

        博弈论本身的思维方式跟常规的思维方式不一样,要求你具有比较好的逻辑思维能力,以及基本的这个数学知识。内含思维方式:一种的话多层嵌套的换位思考

        导论课主要讲四个方面的内容。第一是课程沿革、第二是博弈论的概述、第三是关于效用理论,它是决策论和博弈论的基础。第四点是如何来表述博弈,因为表述一个博弈是我们分析一个博弈的前提。

        你即使可以协商,要是有一方背叛协议,你毫无办法。这样的博弈,我们称之为叫非合作博弈。就是说即使可以达成协议,这个协议顶多只是君子协议,没有约束力。这样的博弈我们称之为是非合作博弈。

        内卷的本质就是囚徒困境,每个参与者从自己的利益出发,做了理性的选择。

(二)辛普森悖论:性别与药物疗效的复杂关系

        讨论了一个被称为辛普森悖论的现象,其中同一数据集可以从不同角度解释出看似矛盾的结果。特别关注了性别和药物对心脏病患者的影响,指出统计数据的处理方式—分别或汇总分析—取决于问题本身的性质和背景。此外,提出了一个假设药物(BBD药物),对男性和女性都有害,但在不知性别的情况下却有益于所有人的例子,进一步说明了这一悖论的复杂性和对数据分析方法的重要性。

        可是如果进来一个病人,这个病人比方说是一个外国人从他的穿的服装完全不能判断他是男还是女,语言又不通。但是他只是捂着胸口说他的心脏不舒服,这种情况下的话,那怎么办呢?就是说我不知道他的性别的情况下,我再看一下这个表会发现这种情况下吃药比较好在不知道性别的情况下吃药比较好,但是一旦知道性别这个药就不能吃。所以这个药称之为BBD药物,对男人有害,对女人有害,可是对不知道性别的男女是有益的。这个是一个非常著名的一个悖论,叫做辛普森悖论。上个世纪50年代美国的一个统计学家发表了一篇文章提出来的。

        在分析数据的时候,要是对数据能够进行分组比较,得到的说服力是更强的。对总体汇总的数据的话,有可能会给出错误的结论。但如果你得到这样一个结论本身的话,这个结论是错误的。到底应当看分组的数据,还是应当看汇总的数据,没有一定之规,取决于这个问题背后的这些因素之间的逻辑关系

        对于第二张表,应当基于汇总数据来分析,而基于分组数据是错误的。对于前一张表,应当基于分组数据来分析,对于汇总数据的分析是错误的,这个也可以严格的数学证明。当然这涉及到的话。但是我是说讲到这儿的话是说我们的很多问题,你会发现他看起来非常像互相存在关联性。

(三) 博弈论与政策科学:从本科到通选课的演进及应用

(四)博弈论精选教材及其深度解析

        本次课程介绍了一系列博弈论相关教材,并详细分析了它们的特点及适用范围。首先提到的基本教材《博弈论和信息医学》由张文英老师编写,是作者初次学习博弈论时使用的教材。接着介绍了其他几本经典的博弈论教材,包括面向经济学学生的《博弈入门》、《博弈论基础》以及《矛盾冲突分析》,并特别强调了迈尔森的《博弈论矛盾冲突分析》作为目前世界上最好的博弈论教材之一。该书以其深入的思考、严密的逻辑和卓越的翻译质量被广泛认可。此外,文中还提到了该书两名优秀的译者——语音和费建平,他们的协作使得中文版的质量得到了保证。

        这边是几篇与博弈的有关的发表的英文文章。左边是今年8月份刚刚出版的一本书,叫《威慑胁迫与谈判,基于博弈论的研究》

        对我还另外推荐了基本的经典教程。第二本这是叫博弈入门,这是马丁.奥斯本写的。第三本的话是博弈论基础。第四个是迈尔森写的博弈论矛盾冲突分析。后面的三本书都是世界上的有关博弈论的经典教程。

        三本书的差异:中间的那一本主要是写给经济学的学生或者经济学者的,所以他举的例子的话都是有关的话企业竞争产业组织方面的例子,所以比较适合经济学的同学。博弈入门这一本书的话,它的好处是他覆盖的面比较广,而且他举的例子涵盖政治经济、法律生活各个方面的例子,同时的话讲述也非常严谨。但是我最推崇的一本书,是最右边的矛盾冲突分析。这本书它是整个是用的话集合论的符号和语言来写的,所以讲的非常简练,非常准确。这是对强调逻辑,强调严谨的同学来说的话,最好的一本教程。

(五)博弈论:一种广泛应用于社会科学与技术领域的思维与方法

        博弈论不仅仅是一种理论工具,更是一种深入理解和分析社会及科技问题的思维方式。通过本课程的学习,学生将被引导打破传统思维模式,培养深层的、换位思考的博弈思维能力。课程不仅系统讲解博弈论的基本思想和方法,还将介绍其在生物学、计算机科学、军事等多个领域的应用实例。

        学了这个课之后,一个方面能够帮助你打破传统的思维定式,培养这种高阶复杂的博弈思维。层层嵌套的换位思考。第二掌握博弈论的核心的思想和方法。这样不仅有助于你理解很多复杂的社会现象,而且有助于你在你自己的专业领域来采用博弈论的思想方法来分析你们专业领域的特定的问题。

(六)博弈论学习指导:抓住核心,理解理性与策略

        在博弈论的学习过程中,重要的是把握住以球均衡为中心的核心,并理解两个基本点:理性和策略。理性的概念指的是每个参与者在博弈开始前制定的完备行动计划,而策略则是这些计划之间的相互作用和反应。通过理解和应用这两个基本点,可以有效地解决许多实际问题并深入理解博弈论的本质。

        那么作为博弈论的初学者,如何才能够迅速的掌握博弈的思维方式,以及他的理解他的这个思想,理解他的方法。要牢牢的把握一个中心,两个基本点。一个中心是以求均衡为中心,两个基本点。第一个基本点是要理解何为理性。第二个基本点要理解什么是策略

        但是博弈论中的均衡:定义为每一个参与者的一个特定策略构成的组合,要求这个组合满足一定的条件。最简单的定义的话就是纳什均衡,要求所有参与者的策略互为之有反应。

        那么什么是策略呢?其实也很简单,策略是每一个参与者在博弈开始之前制定的一个完备行动计划。不管这个博弈本身多复杂,他事前制定的完备行动计划。什么样的策略组合能够构成一个稳定状态,这是博弈论所分析的中心任务。

(七)博弈论与智谋故事:理性共识与信息不对称

        博弈论与传统的智谋故事存在显著区别。传统故事如空城计虽展现了高度的智慧和策略,但在理论上假设单一行动及其结果的不可重复性。而博弈论基于理性参与者之间的互动,其分析结果强调均衡性和可重复性,避免个体因错误而失败。此外,博弈论着重于信息对策略选择和结果的影响,揭示即便极小的信息差异也可能引起截然不同的结果。课程将主要探讨非合作博弈论,区分其与合作博弈论的主要区别在于后者假定了协议的约束力,强调共同利益下的合作可能性。

        就是理性的假定。我们假定所有参与者都是理性的,不仅如此还具有理性共识。就是说不仅每个人是理性的,而且你的对手是理性的,你也知道你的对手知道你是理性的。换一句话说,没有任何人会以为其中有傻子。那么基于这样的假定出发,我们来分析,相当于每个参与者的话都是比诸葛亮还聪明的人。大家知己知彼是不是?这种情况的话,我们来分析这个问题的均衡是什么。

        理性共识的认定不一样。我们回头会定义理性共识,或者共同知识的层次会具体来定义的。我会发现共同知识的城市不一样,参与者的策略选择可能会不一样,博弈的均衡结果也可能会不一样。所以信息以及信息结构很有可能会使得这个博弈的结果发生翻天覆地的变化。即使表面上看起来信息只有一丁点细微的差异,都有可能导致非常大的不同。所以在博弈中的话,这个信息问题是一个非常重要的一个问题。我们这一门课因为只有一个学期,我们这门课集中精力讲非合作博弈论,就是我打了一个非合作博弈论

(八)博弈论在解决集体问题中的应用

        讨论了利用博弈论原理解决集体问题的可能性与挑战,包括非合作博弈中的协议达成及演化博弈论的应用。强调了重复博弈和理性假定对策略选择的影响,并提出了演化稳定状态的概念。

        非合作博弈论跟合作博弈论的差异在于,在非合作博弈当中,即使所有的参与者为了他们的共同利益,他们愿意签署一个协议,这个协议只是口头的君子协议,没有约束力,有任何一方违背协议,对方无可奈何,这叫非合作博弈。

        另外一类叫合作博弈,就是如果双方要签订了一个协议,这个协议是有法律效力的。要是有人违背协议,另一方可以找到第三方的话,来惩罚他。惩罚的这个成本非常高,足以使对方发现违背协议得不偿失。这种情况下,只要任何一方,只要所有的参与者的话签了一个协议,那么这个协议就对所有的参与者有约束力,这就是合作博弈。合作博弈跟非合作博弈的这一点,对协议的强制力的假定不同,导致这两类博弈问题完全不同。

        博弈的规则不一样,策略选择均衡的结果也可能会不一样。后面还有两类,一类叫演化博弈论,一类叫行为博弈论。

        演化博弈论他是放弃了理性的假定,放弃了参与者是理性的这样一个假定。然后假定所有参与者,比方说像新冠病毒、细菌或者植物或者动物,他们不会选择自己的策略,但是他们通过遗传变异的机制,每一代从自己的父辈那个地方遗传他的这个行为模式,生存竞争,优势劣汰,适应度更好的这样的个体能够存活下来,繁殖更多的后代。因为它能有拥有更多的资源,更多的繁殖的机会,所以它就能够繁殖更多同类的个体。那些竞争中落了下风的个体就会被淘汰,慢慢的被淘汰。经过这样反复的一轮一轮的这种生存竞争演化,最后能不能达到一个稳定状态?这是演化博弈要他的分析的方法。

        演化博弈论的话,你看跟我们讲的经典博弈论(就是基于理性的假定出发来进行分析),这两者之间的话假定完全不一样。但是他们的最后达到的结果的话就惊人的相似。演化稳定的状态一定是基于履行假定的均衡状态而显示的话,是比一般的纳税均衡更强的均衡,更严格的均衡。

(九)行为博弈论及其在经济学中的应用

        行为博弈论关注现实中人在特定博弈问题中的行为选择,并通过这些选择推断其思维过程,以与基于理性模型的预测进行对比。该领域隶属于行为经济学,着重于个体决策问题与博弈情景的应用。教学方法采用启发式和互动式,结合实际案例及实验,旨在深化学生对博弈论的理解和应用能力。

        还有一类叫行为博弈论,行为博弈是什么意思呢?就是说我们是观察现实生活中的人,他们在一个具体的博弈问题中。比方说博弈有可能是生活中的博弈,有可能是我们在实验室里面特地组织的一次博弈,我们来观察现实之中的人,他们在这个博弈中他们的行为选择。但是我们希望通过对现实生活中人们的行为选择,人们在博弈中的行为选择的话,希望能够提炼出一些共同的规律出来。这叫这是行为博弈论。

        行为博弈论本身的话属于行为经济学的一个分支。行为经济学一般的话它是讲的是一个单人决策问题。涉及到博弈问题的话就是行为博弈论。当然在我们这个课上,如果后面我们安排某些博弈实验的时候,相当于就是行为博弈。

(十)教学资源

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/347489.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI大模型的战场:通用与垂直的较量

AI大模型的战场:通用与垂直的较量 引言:AI界的“通才”与“专家” 在AI的大千世界里,有这样两类模型:一类是像瑞士军刀一样多功能的通用大模型,另一类则是像手术刀一样精准的垂直大模型。它们在AI战场上展开了一场激…

E: 仓库 “http://download...graphics:/darktable/xUbuntu_22.04 InRelease” 没有数字签名

问题 Ubuntu22.04装了darktable软件没装好,已经卸载了但是没卸载干净,终端使用 sudo apt update 出现的问题: 解决: sudo nano /etc/apt/sources.list.d/*darktable*.list找到了该软件的相关仓库条目:直接给他注释掉就行了。

使引用作为函数参数将变量i和j的值互换

C之所以增加引用机制,主要是把它作为函数参数,以扩充函数传递数据的功能。 解题思路: 传递变量的地址。形参是指针变量,实参是一个变量的地址,调用函数时,形参(指针变量)得到实参变…

WWDC24 快速回顾

今天凌晨,苹果公司在2024年全球开发者大会(WWDC24)上,发布了一系列的系统更新。然而,对于期待苹果带来突破性创新的消费者来说,今年的大会似乎并没有达到预期的震撼效果。 下面让我看看,苹果都带…

STM32定时器输出pwm的几种模式

目录 定时器 输出脉冲模式: PWM模式(PWM Mode) 输出比较模式(Output Compare Mode) 总结 占空比: 输出比较模式与占空比 PWM模式与占空比 输出比较模式与PWM模式的结合 输出比较模式实例&#xf…

汇凯金业:上海黄金交易所简介

上海黄金交易所(SGE)是中国唯一合法进行黄金交易的国家级市场,遵循公开、公平、公正和诚实信用的原则,在中国人民银行的领导下,于2002年10月30日正式开业。交易所不以盈利为目的,实行自律性管理。 组织形式及会员 交易所实行会员…

Java:双色球案例

文章目录 题目最终代码及运行结果过程中出现的问题判断选取的小球数字是否满足条件获奖多少没输出其他问题 学到的东西 题目 最终代码及运行结果 package com.zhang; /* 双色球案例: 投注号码由6个红球和1个蓝球号码组成。红色球号码从1——33中选择,蓝色球号码从1…

深度学习-注意力机制和分数

深度学习-注意力机制 注意力机制定义与起源原理与特点分类应用领域实现方式优点注意力机制的变体总结注意力分数定义计算方式注意力分数的作用注意力分数的设计总结 注意力机制(Attention Mechanism)是一个源自对人类视觉研究的概念,现已广泛…

jenkins 自动化任务构建案例

一新建Item 输入一个名称,点击Freestyle project 进入到配置项 选择 This project is parameterized,点击String Parameter 添加 变量值 command添加执行的命令 二构建 点击build构建触发器 三查看控制台 控制台输出信息无误

VB.NET实现上位机自动识别可用串口

在实际应用中有时会牵扯到挑选可用串口,比如上位机和从站设备使用Modbus RTU协议进行通讯时需要选择COM串口,每次启动连接前都在设备管理器查看较为麻烦,可以设置一个串口自动识别功能,如果选择了错误的串口还可以提示串口选择错误…

fdtd(时域有限差分)仿真

FDTD Solutions 是一款非常好用的微纳光学设计工具。该软件提供了丰富的设计功能,支持 CMOS 图像传感器,OLED 和液晶,表面计量,表面等离子体,石墨烯,太阳能电池,集成光子组件,超材 料…

2024年水利水电技术与能源环境国际会议(ICWRHTEE2024)

2024年水利水电技术与能源环境国际会议(ICWRHTEE2024) 会议简介 2024国际水利水电技术与能源环境大会(ICWRHTEE 2024)将在中国深圳举行。 我们主要专注于水利水电技术和能源环境研究领域,致力于为国内外不同大学、研究院所、企事业单位的专…

11_1、多态性:概念及运算符重载

多态性 多态的概念和类型多态的类型多态的实现 运算符重载运算符重载的概念和规则概念规则 运算符重载为类的成员函数双目运算符单目运算符 运算符重载为类的友元函数双目运算符重载单目运算符重载 多态的概念和类型 消息:消息在C编程中指的是对类的成员函数的调用…

[2024-06]-[大模型]-[Ollama]- WebUI

主要涉及要部署的前端webui是来源于:https://github.com/open-webui/open-webui 正常就使用: docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-web…

【机器学习】基于CNN-RNN模型的验证码图片识别

1. 引言 1.1. OCR技术研究的背景 1.1.1. OCR技术能够提升互联网体验 随着互联网应用的广泛普及,用户在日常操作中频繁遇到需要输入验证码的场景,无论是在登录、注册、支付还是其他敏感操作中,验证码都扮演着重要角色来确保安全性。然而&am…

不谈AI能替代什么,就聊能帮我们干活的AI客服机器人!

最近在直播群里有老板在找客服外包,因为客服压力大,接不过来了,想找找外包支援一下。据了解电商客服除了压力大,还会遇到过量的重复劳动,比如我们问一个产品,同一天可能就有几百上千客户问同样的问题&#…

[Shell编程学习路线]--shell中重定向和管道符(详细介绍)

🏡作者主页:点击! 🛠️Shell编程专栏:点击! ⏰️创作时间:2024年6月12日10点50分 🀄️文章质量:93分 ——前言—— 在Shell编程中,重定向和管道符是两个…

短剧系统满足个性化需求,推动行业持续发展

一、短剧市场背景,行业发展迅速 随着科技的不断进步和观众需求的日益多样化,传统的影视制作方式已无法满足市场和观众的需求。因此,随着ai智能运用的发展,短剧系统以用户体验为中心,围绕观影体验和增强用户黏性展开设计…

mac 安装HomeBrew

目录 一、HomeBrew是什么?二、HomeBrew命令1、检查是否安装HomeBrew2、更新brew版本 三、安装HomeBrew1、官网安装2、100%成功安装 一、HomeBrew是什么? homebrew是一款Mac OS平台下的软件包管理工具,拥有安装、卸载、更新、查看、搜索等功能…

echart盒子没有跟着当前div大小变化而自适应

一、问题描述 当echarts图表在一个盒子里的时候,盒子大小变化了,但是图表没有跟着自适应,比如这样,盒子变大了,但是图表没变化 二、解决方法 在盒子大小更改的同时,调用图表的resize方法,记…