游戏版《西部世界》来了!NPC全由AI操控,行动自如有理想和记忆,基于最新GAEA技术系统打造...

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT彻底引爆了AI领域,也点燃了各赛道玩家的热情。

以虚拟交互体验为例,就已经有不少新产品冒头。

不仅像Chat D-ID这类以ChatGPT驱动的虚拟女友bot花样百出,就连游戏AI NPC也变得火热起来,这几天知名游戏公司育碧要推出AI工具Ghostwriter一事,更是引起了巨大关注。

8825da9f09a2b42632ec7f80b31222bb.png

不过这些都还只是用AI驱动单人NPC对话。

如果能用AI操控NPC、甚至搭建出一个AI社会呢?

前不久,一个名为“活的长安城”的技术Demo引发讨论,其中NPC不仅全由AI操控,彼此之间还能互动:

38b704c211bb280c28d242d1da40098e.gif

要做的事也不会脱离性格和目标,如只想摸鱼翘班的捕快、立志当首席的舞女:

7c9b56ed24277757d7f6c5f7af61cbb8.gif

这场景,属实有点《西部世界》内味了!

但与《西部世界》不同的是,这些NPC没有预设剧本,也不会消除已有的“记忆”。

8b50155c9bcdc41eaab13a0f3ba436af.gif

它究竟有何不同?又是如何运转起来的?

“活的长安城”,有何不同?

据上述Demo的发布方最新介绍,“活的长安城”是一个还在演进中的“AI社会”,背后由一个名叫GAEA的技术系统驱动。

(之所以还在演进中,是因为它只运转了30天,更像是一个社会雏形)

而以“活的长安城”为代表的“AI社会”具备以下特点:

  • 包含一群身份多样、能互动的、受社会常识和反馈影响的AI

  • 这些AI的生活环境开放,能受交互反馈影响产生文明,反过来影响AI未来生活

这也导致在身处“AI社会”的AI NPC,与其他虚拟世界如游戏中的NPC有很大不同。

首先,与众多为剧情设计的NPC相比,AI NPC有自己的目标和行动理由。

在不少游戏中,NPC的目的只是引导用户走完剧情,即便用AI生成对话,这一目标也不会改变。

9561e5097ac393a37a58c8c249381ecf.png

但“AI社会”中的NPC不仅有各自的长期目标,当下也需要为生存等短期目标而考虑,换而言之,它们和人一样有需求,并根据性格和心情状态做出不同的行动。

98496017b596081e6866ace0a78f5a1e.png

此外,与其他游戏NPC不同的是,这些AI NPC还能“观察”其他角色的行动

就像你走在大街上会观察路人一样,AI NPC也会在一定范围内观察你和其他NPC。如果有人吵架、或是举止异常,他们还会化身吃瓜群众上来围观。

4b2867809f512aae3f8a7db7f0d0885f.png

最后,相比其他游戏NPC,这些AI NPC拥有社会常识,能“记住”看见和做过的事,并影响之后的行动。

例如舞女决定对路人出手援助,是因为她没有遇到过“受骗”的事情。如果她目睹或经历了类似事件,那么AI就会降低她援助别人的几率。

0a6a21acc1b1dac55e1d9f0c718102ee.png

这些特点,也导致了“AI社会”不需要预设剧本,就能让AI NPC自己碰撞产生故事,积淀到社会中后又能回馈到NPC身上,反过来影响AI NPC的行动决策。

听起来很有意思,但具体到技术上,会发现实现起来并不简单。

拆解GAEA两大核心系统

从公开架构来看,GAEA分为灵魂系统环境系统两个子系统。

93a3853a3e863efe301c032d749f3935.png

这其中,灵魂系统相当于AI NPC的大脑和行动中枢,环境系统则包含“AI社会”的社会常识和物理信息等,它们彼此之间会相互影响交互。

先来看看灵魂系统,它被分为“记忆”和“策略”两部分。

91dfee2bad264e93a5774358764f34de.png

“记忆”又分为内部状态和事件经历两个模块。内部状态用于建模AI NPC做事的“动机”,包含各种实时变化的状态值,如有钱就想摸鱼,不开心就想吵架:

b9713d67cec53c747bece4eabc8e1601.png

事件经历则包括AI NPC一路观察或亲历的事情,用于给AI NPC的行动决策提供参考。例如AI小偷在大街上偷东西被捕快抓住过,它下次可能就不会在捕快出现的场景实施盗窃。

4a4d46f4c835a557114077b491ef5c0f.gif

“策略”则分为上层宏观决策模型和下层交互模型。上层模型是一个长序列策略模型,它有点像AI的大脑,能够基于“记忆”中的社会常识信息+当下的环境系统做出决断,相当于给AI NPC制定一个整体计划:

feea14c90ca6431f2b8763b1d8fac48c.png

下层交互模型则是通过符号系统建模的多任务模型,负责将上层模型做出的宏观决策进一步拆解细分,把整体计划变成一步步实际行动。

再来看看环境系统,它被分为“社会环境”和“物理环境”两部分。

e7b56d22096718164cd6e7c2d95fea6c.png

“社会环境”包含了两方面的内容。

一方面,AI NPC之间通过交互和反馈生成的语言行为关系等信息,会被记录在这个系统里,持续影响AI NPC灵魂系统做出的行为决策;

(当然,灵魂系统驱使AI NPC做出的行动,也会反过来交互中对环境系统产生影响,形成系统自运转)

69d61da7f3b5b82dcdb37292d22e5446.png

另一方面,它包含了运转“AI社会”所需要的所有人类社会常识,例如带有人类社会含义的状态标签(快乐、希望、金钱等)就包含在这个库中,而社会知识和规则也纳入其中。

50b202757549bc2716f7bf789329e5bd.png

“物理环境”就是场景中的各种物理数据了,包括风景建筑和商品水果等实物的建模信息、以及其他NPC的物理建模数据等,让NPC知道能与哪些场景数据发生交互,并指引它们做出具体的行动。

e44f6e00831ee52bb786af0c61cdb681.png

但即便GAEA背后的技术原理已经透露,具体如何实现让AI NPC“更像人”的效果,又是哪些关键技术提升了它的剧情生成细节,仍然是一个未知数。

带着这些问题,我们找到了GAEA背后的团队——超参数科技

据其项目负责人张弛介绍,GAEA综合了不同模型能力,研发周期比想象中要长,大致分为两阶段:阶段一是搭建出完整的迭代场景和技术框架,也就是GAEA1.0;阶段二是着重提升GAEA的剧情生成和自然语言交互能力。

阶段一,团队主要依靠自研的AI BOT技术和长期实践积累的工程能力,一步步完成GAEA的技术选型,让虚拟场景“长安城”自运转起来。

这一阶段,不仅需要着重提升AI NPC的能力,包括丰富的行为表现和自然的语言交流等,来让它们看起来“更像人”,还需要不断改进技术方案和迭代路线,相当于将实验室的内容落地。在张弛看来,后者尤其难,不仅要考虑技术落地,还要具备从系统的角度思考整个NPC生态的产品思维。

他举例说,光是让NPC看起来“更像人”,涉及到的技术就不少。比如,让NPC根据昼夜等常识概念做出合理行动,涉及到模型对社会常识的理解与推理能力;给AI赋予“理想”和生存等现实目标,则要考虑建模NPC内在动机;而支撑NPC海量的行为表现,需要用到多任务强化学习等技术;而有效“记忆”信息提取,得通过特殊的编解码方式来解决……

阶段二,在系统已经能完整运转的基础上,团队引入了大语言模型来提升系统的生成效果。正如原理框架中展示,大模型提升了原有GAEA在目标拆解、AI常识推理和对话等模块上的能力,进一步提升系统的“转速”。

264d1af9c0ad634b9e698e7d4209d908.png

谈及下一步,张弛也做了小小透露,他说团队计划持续优化GAEA的技术细节,利用大模型去进一步提升NPC与真人交互的能力,以及整个生态的剧情生成能力,并对其他方向的AI NPC技术做一些预研布局。

当然,如何将GAEA输出到轻量化、可感知的产品上,建立合作机会,也是他们正在思考的方向。

公开资料显示,在推出GAEA之前,超参数科技已在“AI+游戏”领域取得成绩,包括率先在在3D FPS领域实现大规模商业化落地,AI bot在多款千万日活的头部产品中稳定运营,已经部署到全球50多个国家及地区等。

AIGC催生产业变革浪潮

AIGC这波浪潮推动下,各行各业正在迎来新一轮AI变革节点。

正如比尔·盖茨在《人工智能时代已开启》文章中所言,AI的到来将会极大地提升社会生产力,从而进一步改变人与人之间的交互方式:

整个行业都会围绕它重新定义。

一方面,AI的到来正在不断地提升社会生产力。

以大模型为例,它正在改变很多行业的工作方式、未来甚至能极大地提升行业的工作效率。

另一方面,对于产业本身而言,AI的出现又改变了人与人之间的交互方式,从而带来产品的新一轮爆发。

在红杉资本两位合伙人与GPT-3联合撰写的一篇名为Generative AI:A Creative New World的文章中,更是预测AIGC技术会如当年移动通信一样,诞生一轮“杀手级应用”。

ca526bb2b5b20ce78c25857bee52f008.jpeg

简而言之,这些新技术的出现,不仅会给产品开发过程带来变革,催生出产品交互方式、乃至于产品本身的进化,甚至带来AI原生产品。

至于如何应对这波AIGC浪潮?有玩家选择All in新技术,开辟新场景;也有玩家质疑新技术应用前景,选择再观望一波。

超参数科技GAEA项目负责人张弛接受采访时表示:

随着技术迭代,市场的不断竞争,我相信大模型的调用成本一定会持续降低。

因此,现阶段该聚焦的还是如何在原有技术积累上用好大模型,做出完全不同以往的东西,给游戏或未来产品带来新的可能性。

—  —

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23047.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

无人出租车被警察截停后逃逸!AI:我当时害怕极了

新智元报道 编辑:好困 袁榭 snailnj 【新智元导读】愚人节当晚,在美国旧金山上演了史上第一场无人驾驶汽车被警察截停后逃逸的事件,画面爆笑。 警察拦车很常见,但是拦AI开的出租车你见过么? 在最近爆火的一段视频中&…

H5营销海报如何制作,在线制作平台分享

互联网影响着我们的生活习惯,很多人获取消息不再是从别人口中听到、从电视上看到、从报纸上阅读到,但一切消息皆可以从互联网上来获取。而商家们也可以通过互联网进行高效、精准的宣传,方式很简单。通过H5海报制作,巧妙的利用互联…

fast-poster 海报生成器,一分钟完成海报开发。

fast-poster 海报生成器,一分钟完成海报开发。 曾几何时,开发一个海报功能,需要调用底层的绘图API,要熟悉各种不友好的GUI代码。 经过N次迭代和线上生产环境的考验。 现在,开发一个海报功能,只需三步。 …

漫画:是喜,还是悲?AI竟帮我们把Office破活干完了

图文原创:亲爱的数据 国产大模型烈火制造。阿里百度字节美团各科技大佬不等闲。 大模型嘛,重大工程,对我等“怀保小民”来说,只关心怎么用,不关心怎么造。 我来介绍一下自己,我是一个写稿男团组合的成员&am…

腾讯云开发者2022年度热文盘点

01 十亿人都在用的健康码运维体系如何设计? 随着疫情防控模式的迭代,健康码访问DAU逐渐趋于下跌,意味着健康码将逐步完成历史使命,见证着疫情的结束。本文特邀腾讯研发工程师李雄政将从技术架构、可观测体系、运营保障体系等运维体…

“F1 车王”昏迷 10 年能受访了?某杂志 AI 生成“舒马赫专访”惹众怒,涉事主编遭解雇...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在赛车世界中,“车王”迈克尔 舒马赫(Michael Schumacher)是无数人心中最伟大的 F1 赛车手:前 16 年的职业生涯几乎刷新了每一项纪录,共获…

马斯克损失126亿美元,仍为世界第二富!网友:“公司太多的烦恼?”

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 送人类移民火星,一直是“钢铁侠”马斯克的梦想。 然而,作为拥有 SpaceX 42% 的股份大股东,马斯克近来却事与愿违——火星没去成,还交足了…

「GPT-4.5」来了!地表最强Code Interpreter与Midjourney联动,5分做出大片|附保姆级攻略...

来自|新智元 【导读】Code Interpreter解禁后,可谓游戏规则的改变者。与Midjourney联动做大片,表情包生成,动嘴做表,各种潜能全被一众网友们挖掘出来了。 前段时间,GPT-4变笨引爆舆论,有人甚至把…

GPT-4.5来了!地表最强Code Interpreter与Midjourney联动,5分做出大片 | 附保姆级攻略...

©作者 | 桃子 好困 来源 | 新智元 Code Interpreter解禁后,可谓游戏规则的改变者。与Midjourney联动做大片,表情包生成,动嘴做表,各种潜能全被一众网友们挖掘出来了。 前段时间,GPT-4变笨引爆舆论,有人…

面试不过,大部分是基本功不扎实,来看看这份“地表最强Android面试宝典”

前言 金九银十还有两个月就要来了,错过金三银四的朋友可不能再错过这个黄金时间了。 今年的互联网就业形势 互联网过去几年飞速发展,给的待遇比其他行业都要高不少,并且过去几年入门门槛很低,基本去机构培训几个月就能上岗&…

「GPT-4.5」来了!地表最强Code Interpreter与Midjourney联动,5分做出大片|附保姆级攻略

【导读】Code Interpreter解禁后,可谓游戏规则的改变者。与Midjourney联动做大片,表情包生成,动嘴做表,各种潜能全被一众网友们挖掘出来了。 前段时间,GPT-4变笨引爆舆论,有人甚至把3小时25条额度一口气用…

2022的结尾,对话系统起飞了

文 | 郑楚杰知乎 编者记:近日来,ChatGPT的连续刷屏让人们重新看到了AI的希望,编者通过对ChatGPT的试用,发现其对话能力早已不同于两年前的对话系统了,可以说,有了质的飞跃,向着用户体验奇点迈进…

地表最强Code Interpreter与Midjourney联动,5分做出大片,网友称「GPT-4.5」来了!

夕小瑶科技说 分享 来源 | 新智元 Code Interpreter解禁后,可谓游戏规则的改变者。与Midjourney联动做大片,表情包生成,动嘴做表,各种潜能全被一众网友们挖掘出来了。 前段时间,GPT-4变笨引爆舆论,有人甚至…

OpenAI最强多模态语言模型来了:GPT-4发布

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

六足仿生机器人的控制与实现

目 录 摘 要 I Abstract II 1 文献综述 1 1.1 国外六足仿生机器人的发展情况 1 1.2 国内六足仿生机器人的发展情况 2 1.3 六足仿生机器人研究中存在的问题 2 1.4 六足仿生机器人的发展趋势 3 1.5 论文的主要内容 3 1.6 小结 4 2 六足仿生机器人的结构分析与步态规划 5 2.1 昆虫…

仿生蛇机器人

仿生类机器人 开头蛇形机器人研究意义结构分析生物结构分析 运动学分析 总结 开头 好久没写这个了,事情太多了,把这学期学的一些分享放上面。随便看看吧。仿生机器人是机器人的一个分支。相比于刚性齿轮结构和传动结构,一些动物的柔性结构使…

仿生水下航行器

仿生水下航行器 前面介绍的水下航行器的设计,大部分都是螺旋桨推进,虽然目前仍然广泛用于各种成熟的产品或者研发作品中,但是不得不承认的是螺旋桨在水下的推进的效率较低,对水下环境的扰动较大,不利于隐蔽&#xff0c…

仿生机器人

“仿生机器人”是指模仿生物、从事生物特点工作的机器人。当今世界,科技发展水平日益进步,机器人研究领域已经向航空航天、水面水下、地下管道等环境发展,未来的机器人将在人类无法工作的环境中代替人类工作,人们要求机器人不仅适…

仿生机器鱼设计

锐晶-Recrystal-重塑仿生机器人 欢迎进入Recrystal世界 分享在仿生机器鱼研制过程的一些心得与体会,最想与志同道合的朋友一起完成我们的梦想! 新的起点 机器鱼3D图,整个机器鱼外部结构件采用3D打印。 机器鱼3D图 舵机工作原理 机器鱼内…

仿生机器人研究

仿生机器人是指依据仿生学原理,模仿生物结构、运动特性等设计的机电系统,已逐渐在反恐防爆、太空探索、抢险救灾等不适合由人来承担任务的环境中凸显出良好的应用前景。 研制仿生机器人的灵感来源于自然界中的动物,比如蜥蜴是有着优秀运动能力…