用ChatGPT控制NPC,行动逼真到像正常人!斯坦福谷歌新研究炸场,赋予大模型准确记忆力...

萧箫 发自 凹非寺
量子位 | 公众号 QbitAI

放任25个AI共同生活,他们竟然模拟起了人类的行动!

0723d27e0b0273f3632227ce301ad2bd.gif

不仅像人一样起床、刷牙、吃饭、睡觉,还会被迫“出门打工”,甚至在闲暇时分一起庆祝节日。

这一切,来自斯坦福和谷歌的一项新研究——

他们做了一个很新的实验,创造了25个AI NPC,每个NPC都有不同的身份和行动决策,并让它们在一个沙盒环境中共同生活,背后依靠ChatGPT大模型来完成行动决策。

6eb5d4435c96697ebcfe83c9fd8dbcef.png

结果发现,这些AI NPC不仅会像人一样生活,如作家就去写作、店主就去经营商店,而且他们彼此之间还会发生交互,甚至产生对话:

345c424ba656e4004103ffc19c6aaf7c.png

研究一po出就爆火,宾大沃顿商学院教授Ethan Mollick表示:

这些行动相比“角色扮演”,更像是正常人类会做出来的行动。

d3ece1b665f3b8ecdc8e2f5475cdf25c.png

OpenAI科学家Andrej Karpathy更是直呼“这让开放世界游戏相形见绌”:

5adc5cff163f997d8305fc7aa3675215.png

所以,这个研究究竟构建了一个怎样的“AI社会”?

当AI玩起模拟人生

从Demo展示来看,这25个AI有着不同的身份、性格和年龄:

c030e2768c9861ef42e2d9aa81f5961f.png

他们会在一个共同社区中生活,这些社区的构造非常详细,包括居住区、大学、公园、咖啡厅等:

0df5952911bae183389f827a6efb5358.png

可以看见,每个AI都有自己的基础行程,包括起床、洗漱、吃饭、睡觉等,根据不同的身份设定,又会做出不同的行动,共同维持社区的运转。

其中,Demo中的emoji简单代表了AI正在进行的操作,如收发信件和吃饭:

58b8a81019c656fb5746b486eb19307b.png

但在这其中,也会有交互行为产生:

fc47bb4ce7d0cf2e2be32cc0da376ac8.png

用的也不是AI的语言,而是人类说话的方式:

da684adec2628a7320990427b8587aa1.png

不仅如此,这些相互之间可以产生互动的AI,甚至还能听取人类玩家的要求,并采取对应的行动。

例如论文作者提到,他们以人类的身份告诉其中一个AI NPC,希望在社区举办一个“情人节派对”的活动。

没想到,这位AI NPC不仅热情地答应了作者们的请求,自发开始组织起这场活动,包括时间地点和到场人物等:

26e8502b71fe6799dbc5b5fd0433497c.png

看到这里,已经有网友表示“太疯狂了”——

对于玩家来说,相比遵循步骤,以后在游戏中可能真的需要去说服NPC或思考并采取行动,才能完成任务。

573a687e7f50e9554a1d1a5c4b32e10f.png

还有脑洞大开的网友想到了更加“邪恶”的玩法:

想象你杀死了一个NPC,然后坐车回到城市,看着他们为他举办葬礼……

9a08d921a7518c77ea8634168953c7b1.png

那么,这些AI究竟是如何自发行动,构建起一个自运转的AI互动社会的呢?

用大模型控制行动决策

具体来说,斯坦福和谷歌分两步让AI们采取行动、与其他AI发生交互。

第一步,是构建各种各样的AI“人设”,并让他们做出符合设定的日常行动来。

这里我们以其中一个AI角色John Lin为例,在Demo中可以找到他的设定列表。

可以看见,他的设定非常详细,包括基础信息(姓名、年龄、位置、时间),注意力设定(视野范围等),个人情况(性格、家庭背景、工作等)。

739765fd521b78249ce0baf142e6a094.png

以此为参照,这位名叫John Lin的AI就能形成每天固定的生活习惯,包括早起例行洗漱,然后上班,最后回家睡觉。

abb531e6aa97ddd917f4792df59882a1.png

但在他的生活过程中,必定会与其他AI沟通、或是遇到新人,于是——

第二步,就是要让AI人设对外界环境和其他人的行动做出反应,产生交互

于是,这项研究构建了一种赋予AI记忆力、检索记忆、感知、反馈和交互等能力的架构。

e200d9ed79a1911b8a8e8790df536093.png

从架构图来看,AI会首先感知周遭环境,并将一定视野(注意力)范围内发生的事件记录下来,加进自己的记忆流(memory stream)中;

随后,无论是AI计划要做的事(plan)、还是对外界发生的事情给出反馈(reflect),都会受到这个记忆流的影响,具体方式是通过从记忆中检索对应的事件,并依靠大模型ChatGPT来进行决策

(当然,无论是计划还是反馈,对应的事件也会加入记忆流中,成为新的记忆)

最后,这些决策的结果将被转变为具体的方案,促使AI思考并做出具体的行动。

研究提到,之所以采用大模型+记忆架构的方式,是因为大模型虽然已经具备非常好的行动逻辑性,但无论是GPT-4还是其他大模型,长期规划和保持清晰的记忆仍然是一种挑战。

基于此,需要一套记忆系统作为大模型的“参照物”,让它在采取决策的时候有清晰的事件列表可以回溯。

efbe5327cdeae3fe28d9a8774aad2776.png

不过,这项研究也提出了一些关于AI安全的问题。

包括如何防止它对社会产生的影响,同时被有心之人用于生成Deepfake和“定制版”AI诈骗等——

例如,以后和你聊天的AI卖茶小妹,可能不仅会记得你说过的每一件事情、每一个生日,甚至还能以此为参照,生成更加“贴心”的回答,让“她”看起来更像一个人……

291657d2217a0e80d3cfd7d371d3c50a.png

One More Thing

值得一提的是,此前国内也已经有名叫超参数科技的公司做出了类似的AI NPC系统GAEA。

和斯坦福谷歌这项研究一样,GAEA同样具备记忆系统,并依靠大语言模型来帮助NPC做出行动决策。

8a339ecdfcfb68e025e03c6eff052a98.png

不过,二者促使AI产生行动的激励机制有一些差异。相比这项研究依靠大模型来完成行动决策:

b27f9857af9d4c27094ed31cf41c4048.png

GAEA中的AI还会额外依靠更具体的数值,进一步影响NPC的行动决策(饥饿值、心情值等):

9971f094164eda709ed3f1094c12191d.png

对于这类AI NPC技术,你还想到了什么脑洞大开的玩法?

试玩地址:
https://reverie.herokuapp.com/arXiv_Demo/#

论文地址:
https://arxiv.org/abs/2304.03442

参考链接:
[1]https://twitter.com/emollick/status/1645499660402925576
[2]https://twitter.com/karpathy/status/1645485475996790784

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21791.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT背后的技术和多模态异构数据处理的未来展望——我与一位资深工程师的走心探讨

上周,我和一位从业三十余年的工程师聊到ChatGPT。 作为一名人工智能领域研究者,我也一直对对话式大型语言模型非常感兴趣,在讨论中,我向他解释这个技术时,他瞬间被其中惊人之处所吸引🙌,我们深…

openai项目部署服务器,使用反向代理时候,响应数据缺失的问题

openai项目部署服务器,使用nginx配置反向代理后遇到的问题 一、问题描述二、问题解决 一、问题描述 openapi的问题,当你成功科学上网接入chatgpt3.5的时候(使用的是流式响应),在本地跑应用如丝般顺滑,然后满心欢喜的把应用部署上…

ChatGLM模型通过api方式调用响应时间慢怎么破,Fastapi流式接口来解惑,能快速提升响应速度

ChatGLM-6B流式HTTP API 本工程仿造OpneAI Chat Completion API(即GPT3.5 API)的实现,为ChatGLM-6B提供流式HTTP API。 文章目录 ChatGLM-6B流式HTTP API前言一、下载代码安装环境二、接口服务脚本代码三、运行启动命令总结 前言 现在市面上…

相见恨晚,这才是横跨三大操作系统的终极神器!真的太太太好用了。。。

点关注公众号,回复“1024”获取2TB学习资源! 此前给大家推荐过无数的Chrome插件,涉及工作、生活、学习、娱乐等方方面面,大大提高了浏览器的可玩性。 但回到桌面端,我们依然还是需要下载大量的软件客户端,来…

str.replace()——Python的“第四”字符串格式

str.replace(),Python的“第四”字符串格式。 【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单…… 地址:https://lqpybo…

详解Handler

详解Handler 文章目录 详解Handler1.Handler的工作流程1.1主线程具有如上性质的原因1.2流程图 2.Handler流程中的重要的几个方法2.1Message中的属性2.2.1what2.2.2replyTo2.2.3obtain 2.2Handler.post()与Handler.sendMessage()2.2.1post的源码2.2.1.1sendMessageDelayed()源码…

AI_News周刊:第四期

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 News 1.对抗“唤醒人工智能”马斯克招募团队开发 OpenAI 竞争对手 据两位直接了解这项工作的人士和另一位了解情况的人士透露,埃隆马斯克最近几周与人工智能研究人员接洽,商讨成…

tasker配置文件_如何在Android上管理Tasker配置文件和自动执行功能

tasker配置文件 Previously mentioned Tasker is an Android automation powerhouse. We’ll show you how to export and import profiles so you don’t have to create them from scratch. We also have some for you to download and tweak to your heart’s extent. 前面提…

大家都在卷ChatGPT的时候,我已经...

最近因ChatGPT爆火,使得很多人非常的焦虑,下面是我看到的一位好朋友心情!不知道大家是否也有同样的心情!~ 感觉很多人在看到ChatGPT时都有这样的担忧,这样的担忧是不是源自于神经网络如果参数量足够大&…

渗透测试|网络安全常用靶场

搭建教程网络上随便一搜一大堆,这里就不再赘述 vulhub 免费开源漏洞靶场 www.vulhub.org vulnhub 国外的一个靶场,难度中上(类似于真实渗透环境) https://www.vulnhub.com/ pikachu 综合靶场 https://github.com/zhuifengs…

关于渗透测试

今天看到某安全公司网站上有关渗透测试的内容,感觉不错,转了过来 原文:http://cimersec.w92.mc-test.com/index.php/Profession/view/id/9 渗透测试,是指为了对客户目标网络的安全性进行实际检查,进行带有攻击性行为的…

实战渗透--一次对后台登录系统的简单渗透测试

某网站后台登录界面 发现有验证码框 猜想会不会存在验证码绕过的漏洞 首先随意输入用户名密码(用于抓包) 打开burp抓包 分析数据包后 找到对应的传参点 即输入的账号密码还有验证码 这里可以看到 账号和密码全都是明文传输 并没有进行加密 所以更改起来还…

网络渗透测试

1.5指纹识别 指纹由于其终身不变性唯一性和方便性 ,几乎已成为生物特征识别的代名词.通常我们说的指纹就是人的手指末端正面皮肤凹凸不平纹线,纹线规律的排列形成不同纹型。 内容 1.6查找真实IP 在渗透测试过程中,目标服务器可能只有一个域名。 1…

渗透安全测试

渗透安全测试 PTES(渗透测试执行标准),渗透测试的过程包括交互,信息收集建模,Vul-可行性分析,开发,后期开发等。渗透测试旨在提高系统的安全性,而不是为了破坏,不会影响…

【渗透测试基础】越权攻击讲解

01 什么是越权 越权,是攻击者在获得低权限账号后,利用一些方式绕过权限检查,访问或者操作到原本无权访问的高权限功能。在实际的代码安全审查中,这类漏洞很难通过工具进行自动化检测,因此危害很大。越权有两种类型&am…

渗透测试工具

前言 本篇文章总结了很好用的渗透测试工具,会不断更新!!! 供大家学习使用!!! 正文 01 信息收集 1.1 dirsearch 1.1.1介绍: 类似御剑扫描的一款网站目录扫描器,由pyt…

PentestGPT:一款由ChatGPT驱动的强大渗透测试工具

关于PentestGPT PentestGPT是一款由ChatGPT驱动的强大渗透测试工具,该工具旨在实现渗透测试任务执行过程的自动化。该工具基于ChatGPT实现其功能,允许广大研究人员以交互式的方式使用,并指导渗透测试人员进行渗透测试任务的总体进度调控并执行指定操作。 除此之外,Pentes…

利用ChatGPT进行内网域渗透学习

ChatGPT可以直接模拟在域内环境中的命令执行结果 1、查看共享 2、定位域控

考研政治考题分布、单选多选技巧Keywords、大题点默析

文章目录 一、考题分布(一) 选择33道 (16道单选,17道多选:16117250分)(二) 大题5道 (51050分) 二、选择技巧、选择题规律Keywords选择题规律 三、大题点默析结构 一、考题分布 (一) 选择33道 (16道单选,17道多选:16117250分) 1-4:马原4道单…

chatgpt-4它的未来是什么?该如何应用起来?

在当今快节奏的数字通信世界中,ChatGPT已成为一个强大的在线聊天平台,改变了人们互动和沟通的方式。凭借其先进的AI功能、用户友好的界面和创新技术,ChatGPT已成为个人和企业的热门选择。 然而,ChatGPT的未来有望更加激动人心和具…