ucl计算机教授汪军,UCL汪军教授开课:带你入坑多智能体机器学习(免费)!

人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远。要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进行互动,由此产生了人工智能的一个前沿研究领域:多智能体学习。

很多领域中都存在多智能体学习的问题,在这些问题中,多个智能体不仅能与环境相互作用,而且彼此相互作用,由此造成的复杂和多变也为研究带来了诸多挑战。多智能体学习在现实生活中有着广泛的应用,比如无人机群的控制、仓库机器人的合作、分布式传感器网络/交通的优化、机器竞标,等等。

课程介绍

本课程基于伦敦大学学院(UCL)计算机系2020-2021学年度课程Multi-agent Artificial Intelligence (20/21),主要介绍多智能体机器学习。课程将机器学习的研究与博弈论和经济学的研究相结合,包括博弈论、拍卖理论、算法机制设计、多智能体(深度)强化学习等主题,同时还将讨论相关的实际应用,包括在线广告、在线拍卖、生成模型的对抗训练、机器人规划,以及玩在线游戏的智能体。

本课程适合计算机科学以及机械和航空工程等专业的本科生、研究生,从事机器学习、多智能体协同控制等领域的工程技术人员。

本课程完全免费,为英文授课,与UCL授课进度同步,每周五更新。

讲师简介

caa6bc7a1f74dd2265089f3ccd98aa82.png

汪军,伦敦大学学院(UCL)计算机系教授,阿兰·图灵研究所 Turing Fellow,华为诺亚方舟实验室决策推理首席顾问。主要研究智能信息系统,包括机器学习、强化学习、多智能体,数据挖掘、计算广告学、推荐系统等。已发表了 120 多篇学术论文,出版两本学术专著,多次获得最佳论文奖。

课程目录

一、博弈论基础介绍

1.1 博弈论的基本概念

1.2 纯策略纳什均衡

1.3 混合策略纳什均衡

1.4 纳什均衡的存在性证明

1.5 古诺双寡头模型

二、更多博弈形式

2.1 重复博弈(Repeated Games)

2.2 拓展形式的博弈(Extensive-form game)

2.3 位势博弈(Potential Game)

三、纳什均衡

3.1 零和博弈及纳什均衡计算

3.2 极大极小博弈(Minmax Game)介绍

3.3 纳什均衡的线性规划解法

3.4 线性互补问题

3.5 Lemke–Howson 算法求解线性互补问题

四、贝叶斯博弈与拍卖理论

4.1 贝叶斯博弈(Bayesian Game)

4.2 在线拍卖的设置与步骤

4.3 拍卖模式:一口价拍卖与密封式拍卖

4.4 竞价策略与纳什均衡

五、神经网络与深度学习

5.1 深度学习基础

5.2 词嵌入

5.3 深度神经网络层

5.4 卷积神经网络

5.5 循环神经网络

5.6 网络信息检索

5.7 表征学习

5.8 深度强化学习

六、基于值函数的单智能体强化学习

6.1 强化学习基础

6.2 Model-based 方法:马尔科夫决策过程,动态规划求解

6.3 Model-free方法:蒙特卡洛,时序差分,Q-learning

6.4 深度强化学习实例:Atari,Alpha Go

七、多智能体强化学习(一)

7.1 多智能体强化学习介绍及基本概念

7.2 值迭代与策略迭代

7.3 均衡学习:纳什-Q,Minmax-Q,Friend-Foe-Q

7.4 最佳对策:JAL与对手建模,梯度提升,Wolf-IGA

八、基于策略的单智能体强化学习

8.1 策略梯度

8.2 策略梯度理论证明

8.3 函数近似

九、多智能体强化学习(二)

9.1 策略预测的IGA

9.2 动态系统的梯度提升优化

9.3 虚拟博弈

9.4 理性学习

9.5 演化博弈论

9.6 复制动态方程

十、多智能体强化学习(三)

10.1 Emergent behaviours

10.2 智能体建模

10.3 多智能体通信

10.4 多智能体合作

10.5 Many-agent 学习

举报/反馈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68153.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

UCL USL过程控制上下限与产品公差及极差

upper control limit/ low control limit, UCL/LCL : 上控制限/下控制限, 一般是根据产品和过程特性, 统计数据, 按照一定公式及系数, 计算获得; 一般是在/-3sigma 之间; 用于查看过程的受控状态... 控制限的计算 首先计算极差图的控制限, 再计算均值图的控制限; 计算型数据…

抖音无水印下载不求人

1.得到分享 url 2.找到有水印的url chrom 浏览器 按 F12 打开调试 https://aweme.snssdk.com/aweme/v1/playwm/?video_idv0300fa50000c05t58fkppmf0vsga26g&ratio720p&line0 只有 video_id 有用, 其他的参数没用, 精简后的 url 为 https://aweme.snssdk.com/aweme/…

简历怎么写

简历是你进入面试的敲门砖,也是留给意向公司的第一印象,所以这个很重要,必须在这上面做足了文章,一份优秀的面试简历是整个面试成败的重中之重,我们会详细分析如何准备简历才能保证简历不被刷掉。 准备专业技能 关于对…

个人简历计算机水平如何填写,简历如何写计算机水平

简历如何写计算机水平 简历的内容要尽可能详尽,具体。下面小编整理的简历如何写计算机水平,欢迎来参考! 作为现代化办公系统,就是离不开电脑的配合,所以如果你在电脑方面有专长,一定要在个人简历当中表现出…

专用于个人简历的latex模板

介绍 一份简历模板,fork自hijiangtao/resume,自己随意删改了一些东西。地址为:resume 使用 将整个项目直接上传到overleaf上,使用xelatex编译使用本地的texstudio编译 预览 FontAwesome resume-zh_CN.tex 已经导入了 fontawe…

别在简历上写XXX管理系统了,太水!!!

我一直认为程序员的成长就像一个狙击手一样,好的狙击手都是子弹喂出来的。 同理,牛逼的程序员也需要一个个真实项目来打磨。 想要快速掌握开发技能,提升开发水平,做一个优质的项目往往可以事半功倍。 Java程序员从入门到大牛的终极…

程序员(应届生)求职简历模板+LaTex(overleaf)简历制作+博士简历模板分享+简历赏析

LaTex简历制作 模板介绍亮点模板改动 还在网上疯狂找简历模板吗?为改格式而烦恼吗?大牛都用这方法制作简历,精美又优雅–LaTex制作简历。 一份精美的简历能够迅速吸引HR的眼球引起对你的兴趣,特别是对于刚刚步入社会的应届生来说&…

使用Markdown写出一份漂亮的简历

文章目录 背景Markdown编辑器开始写你的简历个人优势项目经历            牧竹子个人技能公司经历项目经验XXXXXX项目 202N.N0.15-202N.N.N 导出文档格式高级版修改样式 背景 每当你要更新简历时是否因为各个平台不同输入框而陷入适配不同的模板,如此以来…

荒谬!高校院长在Nature论文一作位置P上自己名字,还写到简历里...

点击上方“深度学习爱好者”,选择加"星标"或“置顶” 重磅干货,第一时间送达 本文由募格学术撰写 参考来源:豆瓣、顶刊收割机、知乎等 你见过最荒唐的学术造假是什么样子的? 有人直接靠P图为自己得来一份Nature还写到了…

怎样制作一份简历?这些方面内容最好要写上

怎么制作一份简历呢?简历是个人求职的重要材料,它反映了你的个人信息、教育背景、工作经验、专业技能等方面的情况。写一份好的简历可以让你在众多求职者中脱颖而出,增加获得面试的机会。很多小伙伴不清楚简历中应该填写哪些内容,…

简历应该这么写

一、简历篇幅 首先程序员的简历力求简洁明了,不用设计上要过于复杂。 对于校招生,一页简历就够了,社招的话两页简历便可。 有的校招生说自己的经历太多了,简历要写出两三页,实际上基本是无关内容太多或者描述太啰唆…

使用Gitee多人项目协作开发的流程

多人协作开发流程 Step0 所有组员在Gitee上注册账户 http://gitee.com Step 1 组长创建项目例如:CoperationDemo Step2 组长将项目组成员拉进项目,成为开发者 等待其他用户同意邀请 Step3 其他组员同意加入项目,并成为正式开发者 其他成…

申报指南|教你如何优雅地报名、提交项目申请书

「2021腾讯犀牛鸟开源人才培养计划」开始已经20多天了,组委会已经收到不少同学的报名和提案。 还没有报名和准备proposal的同学请注意啦:距离6月21日报名和提交项目申请书截止还有13天! 关于如何报名和提交proposal,不少同学依然存…

GPT-4 竟被 CS 学生「开源」了!OpenAI 威胁:不撤下项目就告你!

转自:新智元(ID:AI_era) 众所周知,ChatGPT 是免费的,但想尝试最新最强的 GPT-4,基本上就只有「氪金」这一条路可以走—— 要么订阅 ChatGPT Plus,要么付费调用 API。 虽然也有一些集成了 GPT 的…

王者登基!GPT-4发布,功能史上最强

源 | 量子位 大家好,这里是 NewBeeNLP。 一觉醒来,万众期待的GPT-4,它来了! OpenAI老板Sam Altman直接开门见山地介绍说: 这是我们迄今为止功能最强大的模型! 有多强? 根据OpenAI官方的介绍&…

时隔26年,微软的人工智能助手终于实现了!地球最强生产力工具Copilot发布

注:本文作者阿法兔,为微软最有价值专家(MVP) *转载请扫码添加后台微信二维码,转载请注明来源,且附上本文的所有参考文献链接。 作者 | 阿法兔 事件 *本文1900字左右 前情提要,在笔者今年1月8日…

华为率先商用卫星通信技术,有助中国在6G技术上取得领先优势

业界人士指出华为发布的mate50虽然不支持5G技术,但是它率先在手机上引入卫星通信技术却具有重大意义,有助于中国在6G通信技术上取得领先优势。 6G技术将不再仅限于移动通信技术,而是天地一体,即是将卫星通信技术融合在其中&#x…

[原创]淘宝天猫抢购软件“tbBuyer“

[原创]淘宝天猫抢购软件"tbBuyer" 淘宝/天猫抢购软件, 多账号多任务, 自动下单付款, 监控捡漏 大家在使用中遇到问题, 可以发邮件告诉我_: 694611825qq.com 软件到我的网盘下载: https://cloud.189.cn/t/zmUNvyVZFfqq QQ群: 240477599

某宝抢购taobaosnap开发与实现

某宝抢购脚本 Taobaosnap Taobaosnap is a completely open tool, which is used to buy goods in seconds on Taobao. This is a project created with python, using selenium and requests module to achieve login and snap-up. The project integrates network script ide…

拼多多、淘宝、天猫、1688、京东、阿里巴巴、速卖通APP商品详情API大全

以下是行业内了解到的一些情况,本帖只展示部分代码,需要全部参数以及更多API调试请移步注册API账号 http://console.open.onebound.cn/console/?ilucy Result Object: { “item”: { “apiStack”: [ { “name”: “esi”, “value”: “{“global”:{…