安波副教授:分布式人工智能进展与趋势

2020-12-31 09:43:19


2020年11月20日,由中国科学技术协会主办,中国国际科技交流中心、中国人工智能学会、新加坡通商中国承办的“中新数字经济与人工智能高峰论坛”云端召开。主题报告环节,新加坡南洋理工大学人工智能研究院联席院长校长委员会讲席副教授安波为我们带来了《分布式人工智能进展与趋势》的精彩演讲。

演讲实录丨安波副教授:分布式人工智能进展与趋势

 

安波

新加坡南洋理工大学人工智能研究院

联席院长校长委员会讲席副教授

 

以下是安波副教授的演讲实录:

 

很荣幸得到这个机会和大家分享关于分布式人工智能进展和趋势的一些看法。期望听完我的分享之后,大家能理解分布式人工智能是什么,为什么要care 这个领域,它最近有什么样的一些进展,以及未来可能会有什么样的一些挑战。

 

过去这些年AI 的进展主要体现在一些比较简单的场景。比如,自然语言处理是相对比较静态的数据;或者围棋的博弈,只有两个player,并且所有对决策重要的信息都可以直接观测到。未来要考虑更加复杂环境下的AI 系统或者一些应用,这个环境是不确定的,甚至是完全open 的(open 意味着我们没有办法感知建模)。另外这个环境里面有多个player,这些参与方之间是竞争的,我们采取的策略是需要序贯的,同时需要进行分布式的优化。这样复杂的问题是分布式人工智能所研究的目标。

 

星际争霸是目前AI 领域最火的问题之一,比如DeepMind 一直投入很大的精力在做,中国有很多初创公司也在做这方面的事情,我们很高兴看到,启元世界在一两个月之前北京的智源大会上,展示了他们最新的研究成果并击败了几位华人顶尖高手。星际争霸是一个特别复杂的问题,包括环境的不确定性和动态变化、多方的竞争、序惯的决策,完全体现了上面所讲的分布式人工智能所研究问题的特点。分布式人工智能覆盖很多其他场景,如军事方面的、金融方面的,也包括中科大陈小平老师团队参与的机器人足球比赛。这些问题相对比较复杂,有很多研究挑战,尤其是我们的解决方案特别需要考虑多个player 之间的竞争。

 

分布式AI 最近几年涌现出来的算法框架大致可以分为两类,一类是把传统的规划算法、算法博弈论,以及运筹学优化算法结合,解决大规模的优化或规划的问题,或者是博弈竞争的问题;另外一类算法基于强化学习,特别是多智能体深度强化学习。

 

接下来我针对这两方面,讲一些成功的例子,以及我们在这上面做的一部分工作。首先我讲一点关于很强竞争的AI 问题,这里需要用博弈论来分析竞争交互。把博弈论的思路应用到有竞争的AI 上,过去这几年有很多成功的例子。比如德州扑克(简称“德扑”),这是阿尔法狗之后最成功的AI 系统,有很大反响。德扑完全没用任何深度学习,是基于算法求解大规模博弈算法的进展。比如,安全博弈论成功应用于很多领域的安全资源调度;还有现在谷歌、百度、Bing 他们的主要收入来自于这些关联词拍卖,而关键词拍卖的成功依赖背后的拍卖机制设计。

 

下面简单介绍一下德扑。CMU 的Libratus 系统是基于他们十几年来在求解特别大规模的博弈算法方面的积累,然后击败了最顶尖的人类德扑选手。其实也有很多团队长期在做这些事情,比如Alberta 大学和DeepMind 都在尝试深度学习来解决德扑问题,基于博弈的思路目前是最好的。像阿尔法狗一样,如果能找到那个最优解肯定是最好的,就不用深度学习。如果一些博弈,能够找到一个近似的均衡,肯定是最好的一个思路。

 

早期的德扑是针对两个人博弈的,尽管能战胜世界上最顶尖的选手,但是在商业上没有太大价值。求解多人德扑是当前学术界的一个open 问题。最近两年的初步进展把多人分成两个队,一个队只有一个人,另外一个队是N-1 个人。我们在这方面也做了一些工作,提出的算法效率远远好过之前提出的所有算法。

 

以前我们做了很多安全博弈论方面的事情,在本质上希望帮助安全部门做安全资源的高效分配。由于用户的特殊性,所以算法必须要完全给出最优的解,或者有近似界的近似解。传统的诸如遗传算法的启发式方法都不能用。这一系列漂亮的研究,不仅有很多理论成果,更重要的是在全世界很多地方得到了真实应用,并且有很大影响。

 

对于涉及到多个竞争参与方的AI 问题,用算法博弈论是一个思路,刚才也展示了,希望这个思路能有很多很好的结果。有另外一些问题,用算法博弈的思路没有办法找到一个好的解。这几年有一个通常的做法,用强化学习来做,我在这里尝试去解释,在什么样的场景下,强化学习会是一个更好的选择?

 

当这个问题不能很好的建模,比如这个环境完全是open 的,不知道怎么model 它,就不能对它很好地进行求解。应用算法博弈论的思路时,首先要对博弈问题进行建模,我们model 那些player的策略空间和效用函数等,当不能很好的model问题时,博弈求解的方法就不能工作;其次,当问题规模特别大时,传统的算法也不能把最优的求出来。如果问题很难近似或者没有一些特殊的结构可以利用时,算法博弈论的思路也很难成功。

 

强化学习及多智能体强化学习是一个特别热的话题,国内有很多团队做了很多很好的工作。当然,现在还有很多挑战,特别是多智能体强化学习还处在起步阶段。

 

接下来展示几个最近做的一些工作。

 

我们做了电子商务平台的反作弊,并应用到电商平台上;还有电商平台组合推荐问题。比如,我们做了一个涉及电商平台多模块推荐的问题,这些模块是完全不同的团队运营,不同的团队在决定应该推荐什么样的东西没办法进行实时通信,所以我们研究了怎样来实现这些模块之间的协调,实现推荐效果的最优化。

 

我们做了一些非常大规模的policy planning问题,比如政府要决定一个policy,这个policy会影响下面很多player 的行为选择,由于player数量很大并且交互复杂,因此需要用到腹部是强化学习来解决这种特别大规模的优化问题。同时大规模分布式系统优化面临通信方面的约束,需要决定什么时候通信?和谁通信?以及通信什么样的内容?我们在这些方面也做了一些初步尝试。

 

总之,现在有很多挑战的问题需要分布式AI技术来解决,比如未来军事方面的应用,可能需要设计无人机及地面机器人的编队能够在陌生的环境执行特别复杂的任务。异构的无人机编队要对环境进行感知、要进行协作,然后要和敌方进行对抗。很显然,这样的环境下,优化必须是分布式的,如果由某个机器人来控制整个编队,整个系统是不鲁棒的,同时通信的代价也特别高。

 

现在分布式AI 已经有了很多有影响力的应用,但是我们看到更多迫切需要解决的应用问题,以及研究方面的挑战,希望能有更多的人参与分布式人工智能方面的研究。

 

(本报告根据速记整理)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/40450.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

李立军副总裁:后疫情时代服务机器人产业的发展机会

2021-01-23 21:27:31 2020年11月14日至15日,由中国人工智能学会、嘉兴市人民政府主办,嘉兴市南湖区人民政府、嘉兴科技城管理委员会、浙江未来技术研究院(嘉兴)共同承办的2020第十届中国智能产业高峰论坛(CIIS 2020&a…

需求推送变革!陈小平教授深度剖析机器人因何由精确性转向灵巧性

陈小平教授从精确性和灵巧性两个方面深入分析了机器人过去取得的成就,及将来面临的挑战。以下是陈教授的演讲实录(为使文章简介规范,略有改动): 讲座内容 机器人灵巧性:需求推动的技术变革 机器人从精确性向…

云米科技的变与不变:毛利率连降3年,核心高管仅剩陈小平一人

近期,纳斯达克上市公司云米全屋互联网家电有限公司(NASDAQ:VIOT,下称“云米”或“云米科技”)发布截至2020年12月31日的2020年第四季度及全年财报。财报显示,云米多项指标出现下滑。 具体来看,云米2020年第…

云米美国上市雷军系持股40% 陈小平:重新定义家的未来

雷帝网 雷建平 9月25日报道 小米净水器生产商云米今日在美国纳斯达克上市,发行价为9美元,以发行价计算,市值超过7亿美元。云米上市也宣告中国“家庭物联网第一股”的诞生。 云米CEO陈小平在上市现场的致辞中感谢了两个人,分别是小…

演讲实录丨中科大陈小平教授《从封闭性到非封闭性:2020到2035年智能机器的机遇和挑战》...

来源:中国人工智能学会 陈小平 中国科学技术大学机器人实验室主任、教授 以下是陈小平教授的演讲实录: 非常高兴有这个机会进行中、新学术交流。本报告包括四方面内容。第一,关于人工智能(简称AI)的两种类型&#xff0…

用 Python 进行音乐创作

文/世界上的霸主 图片来源于网络 投稿邮箱:pythonpost163.com 前言 上期留了尾,卖了关子。接着上回用 Python 播放多声轨 MIDI 文件音乐继续为您说。 如今,许多人尝试用计算机创作乐器,普遍方法是随机生成一段音乐,和…

Github ChatGPT-Web:了解最新AI技术的前沿应用!

近年来OpenAI的ChatGPT模型在自然语言处理领域取得了很大的进展,并且已经在全球范围内得到了广泛的应用和普及。ChatGPT不仅可以用于生成对话和文本摘要等任务,还可以用于机器翻译、问答系统、情感分析等多个领域。ChatGPT已经成为自然语言处理领域的一个…

chatgpt赋能python:Python怎么将界面和程序交互

Python怎么将界面和程序交互 随着互联网技术的不断发展和普及,越来越多的人开始关注于网站的设计和开发。在Web应用程序的开发过程中,与用户进行交互是至关重要的一个方面,而Python作为一种强大的开发语言,可以很好地帮助我们实现…

汇正财经骗局?大盘午后有修复,科创50大涨2.69%

盘面回顾: 沪深创集体调整,收盘沪指跌0.09%,深成指跌0.37%,创业板指跌1.2%,科创50全天占优,收盘涨2.69%。板块个股,早上6G概念股开盘大涨,业绩增长股大受追捧,算力、CPO…

汇正财经骗局?大小指数分化,主板偏强

盘面回顾: 今日大小指数全天分化,沪指保持红盘,创业板一度跌近1%,黄白二线大幅背离,截止收盘沪指涨0.41%,深成指涨0.05%,创业板指跌0.41%。早盘,ChatGPT概念反弹AI应用端持续发力&a…

马斯克又任性了!将推特“蓝鸟”换成“狗头”,意欲何为?

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 自从去年 10 月 27 日马斯克收购 Twitter 、担任 CEO 后,以一己之力凭借“灭霸式”裁员、精确到代码行数的“周报”等职场“骚操作”,让他进阶为互联网流量密码。…

世界杯小组赛频繁爆冷?这或许是强队的谋略 一分钟带你了解2022卡塔尔世界杯赛制

今年的世界杯你赚到钱了吗? 我们这里所说的世界杯是指世界杯决赛圈,也被叫做世界杯正赛。参赛队伍是已经通过世界杯预选赛选拔出的的32支队伍(除了东道主卡塔尔自动晋级)。 世界杯中没有皇马、巴萨、曼联,这些都是俱…

2018世界杯数据清单:真球迷看球必备,伪球迷速成指南(附完整赛程)

导读:每隔4年都有那么1个月,无论是线上还是线下,不管是真球迷还是真球盲,你的社交圈子都会被世界杯话题攻占。每到这个时候,真球迷一言不合就面红耳赤,伪球迷尬聊不超过3句就暴露“球商”…… 用段子缓解尴…

2022年卡塔尔世界杯,分析之前的比赛计算出谁是冠军

2022 年卡塔尔国际足联世界杯即将开始,让我们来玩个游戏吧。 我研究了世界杯上每支球队之前所有比赛的历史数据,以预测从小组赛阶段到决赛以及第三名获胜者的过往球队。 我们将遵循的规则: 查看两支球队之前的比赛,并根据胜负或平…

Python预测卡塔尔世界杯身价最高的英格兰要夺冠?!

文章目录 🏳️‍🌈 1. 数据🏳️‍🌈 2. 绘图2.1 绘制表头2.2 绘制排名、球队以及国旗2.3 绘制身价柱状图2.4 绘制FIFA排名散点图2.5 设置背景2.6 设置标题 🏳️‍🌈 3. 更多可视化项目源码数据:…

神了,用 Python 预测世界杯决赛,发现准确率还挺高

那么四年一度的世界杯即将要在卡塔尔开幕了,对于不少热爱足球运动的球迷来说,这可是十分难得的盛宴,而对于最后大力神杯的归属,相信很多人都满怀着期待,每个人心中都有不同的答案。 今天我就通过Python数据分析以及机…

太硬核!用大数据技术预测足球胜率

点个关注👆跟腾讯工程师学技术 引言| 足球作为世界第一运动,充满了速度和力量的结果,团队与谋略的对抗。人们也说,足球是圆的,恰恰也表明了足球比赛的不可预知性,一切结果都皆有可能。强如巴萨,…

chatgpt赋能python:Python如何处理两个表的关联-实现数据的整合与分析

Python如何处理两个表的关联 - 实现数据的整合与分析 在日常的数据处理与分析中,有时我们需要将两个表格进行关联,以实现数据的整合与分析。Python作为一门常用的数据分析工具,提供了多种方式来实现不同表格之间的关联。 什么是表格关联&am…

Android 14 的首个开发者预览版,推出四大安全增强功能

【CSDN 编者按】2 月 8 日,谷歌正式发布了 Android 14 首个开发者预览版,该版本将继续致力于提高开发者效率,同时推出四大安全功能。该版本将支持跨/多设备登录、应用双开、基于自己的需求定制增强的辅助功能等。 原文链接:https:…

薅!无魔法无限量GPT-4安卓App安装包;Notion AI从入门到精通;最全大模型进展汇总;雇AI给我打零工 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 『大模型进展汇总 (持续更新至4月17日)』应该是最全总结了吧 ShowMeAI资料编号 No.T001 (进入社群获取高清PDF文件&#x…