启元世界CEO袁泉:能力涌现不只与模型大小相关,AGI开启元宇宙实现之路 | 中国AIGC产业峰会...

衡宇 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT和GPT-4引发全球地震,很多人都在思考一个问题:OpenAI的成功路径是什么?

在中国AIGC产业峰会现场,启元世界创始人兼CEO袁泉给出了他的答案,它很好地融合了三大时代红利。

三个红利具体如下:

  • 一是摩尔定律带来的算力红利,尤其是GPU的算力;

  • 二是算法的并行性带来规模可扩展的红利;

  • 三是对无标注数据探索的红利。

2017年,Transformer出现后,OpenAI很快将这三点融合在一起,推出了GPT-1,而后GPT-2、GPT-3……

bca96e99fc7bc1c3605e778b177ff8b5.png

ChatGPT破圈之后,人们对AGI有了更多的理解和认识,而国内,启元世界也于早几年起开始在AGI方向探索。

启元世界成立于2017年。当时,几个联创在纽约听了AlphaGo创始人之一David Silver关于AlphaGo战胜李世石的分享,其中谈到了背后包含DL和RL的AGI技术,从而激发了他们对AGI的兴趣。

成立后,启元世界开始沿着AGI路径,以游戏为切入点,逐渐从互联网、元宇宙破圈。这一次,在总结OpenAI的成功路径后,关于践行AGI这件事,袁泉在活动现场分享了启元视角下的观点。

为了完整体现他的思考,在不改变原意的基础上,量子位对其演讲内容进行了编辑整理。

中国 AIGC 产业峰会是由量子位主办的行业峰会,近 20 位产业代表与会讨论。线下参与观众 600+,线上收看观众近 300 万,得到了包括 CCTV2、BTV 等在内的数十家媒体的广泛报道关注。

演讲要点:

  • ChatGPT是站在三大技术红利之上的一个划时代产物;

  • 在特定问题空间中,几千万参数的transformer就能取得不错的效果;

  • 未来5到10年,AGI的重点是元宇宙,因为元宇宙的本质是互联网丰富的语料、交互和3D开放世界游戏的合体;

  • 涌现能力除了与模型大小相关,还可能和问题领域的规模、AGI是否已在这个领域充分探索,都有一定关联;

  • 将AIGC融入游戏制作阶段,如游戏策划,尤其是数值策划等,会优化整个游戏数值生态的平衡性。

以下为袁泉演讲全文:

站在三大技术红利之上的划时代产物

ChatGPT破圈之后,大家都在分析OpenAI的成功路径。这里我也谈一些启元的思考和实践。

从技术角度看,我们觉得ChatGPT是站在三大技术红利之上的一个划时代产物。

一个红利是摩尔定律带来算力红利,尤其是GPU的算力,可能超过摩尔定律的提升速度。

第二大红利就是算法的并行性所带来的scalable的红利。2017年底、Transformer出现之前,DL的算法,尤其用于做序列数据、序列决策的算法,主要以LSTM(Long Short-Term Memory,长短期记忆网络)为主,很难并行化。

Transformer发布第二天,Ilya Sutskever(OpenAI联合创始人兼首席科学家)就看到它的并行性以及长语境能带来的好处,于是研究转向以此为基础。

第三大红利就是大数据中的未标注数据。我个人觉得,从2016年起,OpenAI就对它开始看重。

GPT-1就是把这三点较好融合在一起的产物,GPT-2在其基础上拓展了10倍,GPT-3又拓展了100倍,这让业界十分吃惊。

RL之父、DeepMind研究科学家Richard Sutton在2019年就提到,之前几十年,AI发展过程走的最大的弯路,就没有用可扩展性来进行研究。

但OpenAI很快把这一套践行到GPT系列大模型上。

践行AGI发展路径的启元方式

启元是怎么践行AGI发展路径的呢?

8973054d36730959eae8fd2756953f4e.png

第一个阶段,从2017年开始,启元用3年时间主要在包括《星际争霸》等游戏世界里探索AGI

从零开始,只用少量的、5000局中韩高手游戏录像作为启动,在游戏中训练AGI。

一个比较有意思的现象是,在特定问题空间中,几千万参数的transformer就能取得不错的效果。基于此,启元把它优化后用到了游戏行业最主流的7大品类游戏中。

第二阶段是游戏世界往互联网世界破圈。2016年左右,OpenAI就开始探究在互联网上是否也能够基于DL、RL甚至AGI来训练很强的智能体。

Transformer出来后,OpenAI发现scalable的方法,这也让全世界发现把AGI技术用在价值大于游戏行业100倍的互联网里,能创造更大的商业价值和社会价值,带来很多机会。

第三个阶段,可能也是未来5到10年的重点,就是元宇宙。我们认为元宇宙的本质是互联网丰富的语料、交互和3D开放世界游戏的合体。

AIGC如何催生元宇宙、在元宇宙中如何训练AGI,使得它能力越来越强,能够完成更多的任务,可能也是未来非常有价值的命题。

最后一步可能是AGI虚实迁移,服务或者应用于现实世界中。

2768bcf69bc5706ed761a4096d621170.png

启元世界的发展过程则主要分两个阶段。

第一阶段是前三年,主要是在各类游戏中训练决策大模型为主,参数级别在几千万或者一亿以内,能够让AI用小样本做启动,甚至从零开始做启动,探索这一类任务的边界。

第二阶段是从2021年开始,我们开始做10亿到100亿参数的语言模型。

背后原因是我们觉得模型的参数大小其实和所解决任务空间的大小、任务下能够收集到高质量语料高度相关。在我们看来,10亿到100亿规模,能和各个行业垂直应用相结合的这一类模型,还有非常大的潜力。

在决策大模型这一块,以《星际争霸》智能体为代表,2020年6月份,我们击败中国星际职业选手,出现了一个今天看来比较反常识的认知,那就是今天看到千亿参数模型可以涌现出100多种不同能力,在当时4900万参数的星际模型现场比赛时,涌现出“维京流”这样的新策略玩法,即按照人类选手的经验和规则去放基地、建造新东西的玩法,给了大家一些启发。

aa89a523ce20d1378e053743b27c8959.pngAI对战人类选手现场

可能涌现能力除了与模型大小相关之外,和问题领域的规模,以及AGI是否在这个问题中已经充分探索到经验的边界,都有一定的关联。

做启发人和陪伴人的AGI

基于决策大模型的技术和平台,目前启元的目标主要是做启发人和陪伴人的AGI

一方面在很多游戏中,比如在线用户不多时,AI陪人互动,陪人去玩。

第二方面我们叫“陪聊NPC”,比如说一局游戏结束后,上一局人机合作胜负如何、战况如何,下一局怎么打,用户都可以和AI进行交流。

还有一部分是将AIGC融入游戏制作阶段,如游戏策划,尤其是数值策划等,会优化整个游戏数值生态的平衡性,这一部分AI探索效率更高,也更能帮助在数值和平衡性方面进行优化。

最近我们在《三国志战棋版》中有一个落地案例。玩法是走格子下棋,几百张地图中,山川河流不一,还有几百个武将,每一局目标也不一样,有攻城、守城、野战、援护、撤退等等。

dbcc7ab30726a703af32c0a9489021a1.gif

这里面就是启元训练的800万参数transformer智能体,可以用通用方式应对不同攻关需求,包括自己探究新的有意思的玩法。

这就是我们觉得并且基于涌现能力,AGI不仅能提升效率,还可能产生很多新的体验价值的原因。

去年开始,启元另一个重点是做陪聊NPC

面向更广泛的虚拟世界,比如一些历史人物和二次元人物,用户也想跟他们深度互动。AGI技术让此成为可能。

我们基于刘备做了一个陪聊NPC,你问刘备为什么喜欢哭?怎么看待阿斗?他都能给出基于人设、基于事实的交互和对话。

5dcec3cc50567785b2cf243903fcef48.gif

在我们看来,AGI技术既能用于游戏中,也可以展现出非常强的破圈能力,尤其是陪聊类、交互类NPC,能把历史人物、虚拟人物、二次元人物等任何之前想交往但是无法接触的人,拉到你身边,进行符合人设和事实的交互和对话。

启元世界成立时,slogan就是“Build intelligence, Understanding worlds, Inspire people”。我们的定位是做好AGI的应用技术和产品研发,并要服务任何场景。

我们初心和目标,还是希望AGI能更多启发人、陪伴人,在数字世界中创造更多的乐趣和价值。

量子位智库「中国AIGC产业全景报告」

开放下载!

行业首份AIGC产业全景报告已经开放下载!

三大类玩家、四种商业模式、万亿规模市场、最值得关注的50家企业,还有具体的赛道部署机会和行业变革机遇,都将在报告内一一分析呈现。更多产业洞察,不容错过。

公众号后台回复 “ AIGC ” 即可下载完整报告~

30976fc862ab96a3729556d9f4c65459.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21656.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大语言模型综述全新出炉:从T5到GPT-4最全盘点!

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年3月份热门报告合集 万字干货:ChatGPT的工作原理 2023年创业(有创业想法)必读手册 ChatGPT等让你效率倍增的22个AI工具 ChatGPT调研…

2023学会Python爬虫,你也能月薪过万!

Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库。它已经成为继Java、C之后的第三大语言,相对于其他语言,它的特点是:简单易学、可移植、可扩展、可嵌入、 丰富的库、免费开源等, Python难度低&am…

ListenData:如何使用 ChatGPT 进行数据科学

在本文中,我们将探讨作为数据科学家如何使用 ChatGPT 来增强您的数据科学项目。ChatGPT 是一个功能强大的工具,可以在工作的各个方面为您提供帮助,从探索和分析数据到生成见解以及帮助您进行编码和故障排除。它还可以帮助您更快地学习数据科学…

Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

LLM的系列文章,针对《Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond》的翻译。 在实践中驾驭LLM的力量——ChatGPT及其后的研究综述 摘要1 引言2 模型实用指南2.1 BERT风格的语言模型:编码器-解码器或仅编码器2.2 GPT风格…

外资企业可以在中国上市吗

一、外资企业可以在中国上市吗 外资企业依照相关法律规定是可以在中国上市的。 需要满足的条件: (一)股票已公开发行; (二)公司股本总额不少于3000万元; (三)公开发行的股…

一种pluntUML实时渲染图片的方法

最近接触到pluntUML,一个很神奇的uml工具,可以非常方便地画流程图、序列图等。 其使用方法,按照从网上检索的文章中,大都是将pluntUML配合文件编辑器(sublime,vscode)使用,并且需要设…

ChatGPT的打字回复效果,原理是什么?我带你们实现!

当下圈内比较火的非 chatGPT 莫属了。 chatGPT 回复效果 相信使用过 chatGPT 的朋友,都会看到,当你提问一个问题时,chatGPT 会一字一字地给你展示出来,而不是一次性给你返回,如下图: 这样做的好处&#xff…

clickhouse数据去重函数介绍(count distinct)

clickhouse提供了许多的去重函数,有精确去重的以及非精确去重的,下面介绍下两种 非精确去重函数:uniq、uniqHLL12、uniqCombined 精确去重函数:uniqExact、groupBitmap 测试数据量:2000w SELECT count(id) from tab…

消息幂等(去重)通用解决方案,真顶!

作者 | 薛定谔的风口猪 来源 | https://jaskey.github.io/blog/2020/06/08/rocketmq-message-dedup/ 消息中间件是分布式系统常用的组件,无论是异步化、解耦、削峰等都有广泛的应用价值。我们通常会认为,消息中间件是一个可靠的组件——这里所谓的可靠是…

TP6关联统计无法去重的解决方案

在tp6中官方手册跟源码中是没办法做到去重关联统计的,因为源代码中的withCount方法,默认是以“*”进行统计。当我们想要统计类型有多少,而不是数量有多少的时候就会非常麻烦。 这时候需要修改源码,将默认的“*”,改成传…

postgreSql根据多个字段去重详细流程

postgreSql根据多个字段去重详细流程 这是测试表的建标语句,需要的可以拿去用。 CREATE TABLE "public"."class_name" ("id" int4 NOT NULL DEFAULT nextval(id::regclass),"class_no" varchar(50) COLLATE "pg_cat…

mysql去重函数:DISTINCT ,与GROUP_CONCAT结合去重

mysql去重函数:DISTINCT ,与GROUP_CONCAT结合 创建表语法distinct多字段去重DISTINCT 结合 group 统计实例 创建表 DROP TABLE IF EXISTS qipa_shop; CREATE TABLE qipa_shop (price varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci N…

tp6 count distinct统计时根据字段去重

代码: AppointmentModel::field([identity])->count(distinct identity)生成的sql: SELECT COUNT(DISTINCT identity) AS think_count FROM dg_appointment;下面是tp6手册内容 我尝试着这样写 发现生成的sql不对 AppointmentModel::distinct(tru…

oracle listagg如何去重

listagg去重 去重思路:利用listagg会忽略null值的特点 按ENTITY_GROUP_RRN 分组,用 listagg 分别合并 EQPT_ID 与 STATION_ID ,同时要求去重 表 T_TEST 数据如下: EQPT_IDENTITY_GROUP_RRNSTATION_IDTOOL-00110493721JITAI-1TO…

【数据去重】海量数据实时去重方案

文章目录 Prologue布隆过滤器去重什么是布隆过滤器实现的核心思想怎么理解 内嵌RocksDB状态后端去重引入外部K-V存储去重 Prologue 数据去重(data deduplication)是我们大数据攻城狮司空见惯的问题了。除了统计UV等传统用法之外,去重的意义更…

listagg结果去重

最近在一个项目中用到了listagg方法,但是在组合结果中出现有重复的情况。默认的结果如下 于是我就写了一个方法对listagg的结果去重,也可以对该格式的字符串去重,方法如下 create or replace function listaggpure(targetStr varchar2,seper…

非常实用的5种json数组去重方法,函数实现思路竟是chatgpt帮我写的!

文章目录 人工智能福利文章方法一 reduce实现思路 方法二 filter和Map实现思路 方法三 变异for实现思路 方法四 for filter实现思路 方法五 for实现思路 写在最后 人工智能福利文章 【分享几个国内免费可用的ChatGPT镜像】【10几个类ChatGPT国内AI大模型】【用《文心一言》1分…

AI自动播——AI虚拟主播帮你实现24小时直播带货技术分享

如今很多淘宝天猫商家会在做直播的时候,会遇到真人主播难招或者真人主播直播时长有限,那么有什么办法解决这个难题呢,这个时候就可以用AI自动播了,也就是AI虚拟主播直播带货。具体怎么操作呢?下面一起来看看吧。 AI自动…

亚马逊账号被关联能申诉得回来吗

关于亚马逊账号被关联能申诉回来吗?小编有话要说。 其实小编是一个特别谨慎的人,在初入亚马逊之前,会了解到亚马逊所有的问题之后,才会注册账号。那么要了解的有什么呢?注册需要的信息,注册的规则&#xf…

社区1月热门文章、ChatGPT工具汇总,强化学习安全和隐私、斯坦福大学CS234《智源社区强化学习周刊》第75期...

No.75 智源社区 强化学习组 强 化 学 习 研究 观点 资源 活动 社区热门文章 Google发布Bard与ChatGPT竞争 https://hub.baai.ac.cn/view/23925 纽约时报:ChatGPT诞生背后的故事 https://hub.baai.ac.cn/view/23835 ChatGPT提示与AI工具、开发工具、低代码工具汇总 《…