米哈游、复旦发布,具备感知、大脑、行动的大语言模型“智能体”

ChatGPT等大语言模型展示了前所未有的创造能力,但距AGI(通用人工智能)还有很大的距离,缺少自主决策、记忆存储、规划等拟人化能力。

为了探索大语言模型向AGI演变,进化成超越人类的超级人工智能,米哈游与复旦NLP研究团队联合发布了一篇基于大语言模型的“智能体”论文。将具备感知、大脑和行动三大功能的智能体,投放在文本、沙盒游戏等实验环境中让其自行活动。

结果显示,这些智能体具备自主感知、计划、决策和交流等拟人化能力,例如,当周围环境变得困难、艰苦时,智能体会自动调整策略和行动力;在社会模拟环境中,智能体会表现出同情等拟人化情感;当两个陌生智能体通过简单交流后,会记住彼此。

该技术框架与之前斯坦福大学、清华大学发布的AI代理游戏模拟实验类似,都是在大语言模型的基础之上构建功能更强大的AI机器人,这为行业的发展起到了推动作用。

论文地址:https://arxiv.org/abs/2309.07864

Github:https://github.com/WooooDyy/-Agent-Paper-List

在这里插入图片描述

根据论文介绍,智能体主要由感知、决策与控制以及执行三大模块组成,通过感知环境、做出智能决策然后执行具体的行动。

感知模块

感知模块用于从环境中获取各种信息,相当于人的感官。可以包含多种传感器,获取不同类型的数据,例如,摄像头获取图像信息,麦克风获取语音信息等。

感知模块预处理这些原始数据,转化为智能体可以理解的数字表示,以供后续模块使用。常用的感知传感器包括:

图像传感器:摄像头、RGB-D 摄像机等,用来获取视觉信息。

声音传感器:麦克风,获取语音、环境声音等音频信息。

位置传感器:GPS、INS(惯性导航系统)等,获知智能体自身位置。

触觉传感器:触觉 ARRAY、触觉手套等,获取物体接触时的触觉反馈。

温度、湿度、气压等环境传感器,获取环境参数信息。

在这里插入图片描述

感知模块需要对原始数据进行预处理,例如,图像去噪、声音降噪、格式转换等,以生成可供后续模块使用的规范化数据。同时,感知模块还可以进行特征提取,如从图像中提取边缘、纹理、目标区域等视觉特征。

决策与控制模块

该模块是智能体的“大脑”,对感知模块获取的数据进行处理、分析,并做出相应决策。可细分为以下子模块:

知识库/记忆:储存各类先验知识、经验,以及执行过程中的观测、经历等信息。

推理/规划:分析当前环境,根据目标任务制定行动方案。如路径规划、动作序列规划等。

决策:根据当前环境状态、知识和推理结果,做出最优决策。

控制:将决策结果转换为控制指令,向执行模块下达执行命令。

决策与控制模块的设计是智能体技术的关键。早期使用基于逻辑和规则的符号方法,近年来深度学习技术成为主流。模块的输入是感知获取的各类数据,输出是对执行模块的控制指令。
在这里插入图片描述

执行模块

执行模块接收控制指令,并将之转换为具体的环境交互行为,以实现相应任务。它相当于人的“四肢”。执行模块连接智能体的 “效应器”,根据控制指令驱动效应器实施行动改变环境。主要效应器包括:

运动执行机构:机械臂、机器人底盘等,改变智能体自身位置或进行物体操作。

语音/文本输出:语音合成器、显示器等,以语音或文本形式与环境交互。

工具/设备操作接口:控制各类设备、工具,扩展智能体的环境操作能力。

执行模块的具体设计与智能体的物理形式相关。例如,服务型智能体只需文本或语音接口,而机器人需要连接并精确控制运动机构。执行的准确性和弹性是影响任务成功的关键。

在这里插入图片描述

在测试实验中,研究人员主要进行了任务、创新和生命周期管理三大类实验,来观察智能体在不同环境中的表现。

任务实验

研究人员构建了文本游戏和生活场景两个模拟环境,来测试智能体完成日常任务的能力。文本游戏环境使用自然语言描述虚拟世界,智能体需要通过阅读文字描述来感知周围环境并采取行动。

生活场景模拟则更加真实和复杂,智能体需要利用常识知识来更好地理解命令,例如,在房间黑暗时主动打开灯光。

在这里插入图片描述

实验结果表明,智能体可以利用其强大的文本理解生成能力,在这些模拟环境中有效地分解复杂任务,制定计划,并与动态变化的环境互动,最终完成预定目标。

创新实验

研究人员探索了智能体在专业领域如科学创新的潜力。由于这些领域存在数据稀缺性和专业领域知识理解难度等挑战,研究人员测试了为智能体配备各类通用工具或专业工具的方案,来提升其对复杂领域知识的理解能力。

在这里插入图片描述

实验表明,智能体可以利用搜索引擎、知识图谱等工具进行在线研究,并与科学仪器设备接口,完成材料合成等实际操作。这使其成为颇具潜力的科学创新助手。

生命周期实验

研究人员使用开放世界游戏Minecraft来测试智能体的持续学习和生存能力。智能体从最基础的活动如开采木材和制作工作台开始,逐步探索未知环境,获得更复杂的生存技能。

在这里插入图片描述

实验中,智能体使用进行高层次计划制定,并可以根据环境反馈不断调整策略。结果表明,智能体可以在完全自主的情况下开发技能,持续适应新的环境,展现出强大的生命周期管理能力。

此外,在社会模拟方面,研究人员探讨了智能体是否会表现出人格和社交行为,并测试了不同的环境设置。结果表明智能体可以展现出某些层次的认知能力、情感和性格特质。在模拟社会中,智能体之间会出现自发的社交活动和群体行为。

本文素材来源复旦NLP、米哈游论文,如有侵权请联系删除

END

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/161821.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

汽车上的A/C按键是做什么用的?

汽车上的A/C按键是做什么用的? 汽车上的a/c 键是空调制冷开关。A/C是空调的缩写,它的全称是air condition,理解为空气调节。它通过空调压缩机的不同运转方式来达到制冷或制暖的目的。 打开a/c 按键之后,因为空调压缩机是靠发动机工作的&…

Linux上Docker的安装以及作为非运维人员应当掌握哪些Docker命令

目录 前言 1、安装步骤 2、理解镜像和容器究竟是什么意思 2.1、为什么我们要知道什么是镜像,什么是容器? 2.2、什么是镜像? 2.3、什么是容器? 2.4、Docker在做什么? 2.5、什么是镜像仓库? 2、Dock…

求臻医学:实体肿瘤FDA/NMPA新获批抗癌药物/适应症盘点

肿瘤分子靶向治疗发展迅速,随着研究的深入开展,多款靶向药物及免疫药物获批。求臻医学根据美国食品药品监督管理局(FDA)公布信息、中国国家药品监督管理局(NMPA)发布的药品批准证明文件,以及各公…

尚硅谷Flink(二)DStream API

目录 🌠不会点 🪐DataStream API ​编辑 🌠 执行环境 创建执行环境 执行模式 触发程序执行 🌠源算子 准备基础类型 从集合中读取数据 从文件读取数据 从 Socket 读取数据 从 Kafka 读取数据 (没学过) …

2.2 如何使用FlinkSQL读取写入到文件系统(HDFS\Local\Hive)

目录 1、文件系统 SQL 连接器 2、如何指定文件系统类型 3、如何指定文件格式 4、读取文件系统 4.1 开启 目录监控 4.2 可用的 Metadata 5、写出文件系统 5.1 创建分区表 5.2 滚动策略、文件合并、分区提交 5.3 指定 Sink Parallelism 6、示例_通过FlinkSQL读取kafk…

【Python从入门到进阶】39、使用Selenium自动验证滑块登录

接上篇《38、selenium关于Chrome handless的基本使用》 上一篇我们介绍了selenium中有关Chrome的无头版浏览器Chrome Handless的使用。本篇我们使用selenium做一些常见的复杂验证功能,首先我们来讲解如何进行滑块自动验证的操作。 一、测试用例介绍 我们要通过sel…

C# Winform编程(5)菜单和菜单组件

菜单和菜单组件 添加菜单编辑菜单 添加菜单 将MenuStrip控件拖拽到Form窗体顶部添加菜单 编辑菜单 添加菜单项,编辑菜单属性等功能。 右键单击已添加的菜单项可以弹出右键菜单: 可以设置菜单图标,使能菜单,显示快捷键、转换菜…

C语言初学者工具选择:vscode + MSYS2 + cmake 搭建 C环境

文章目录 前言1. MSYS2 安装1. 下载安装包2. 安装3. pacman 换清华大学源4. 安装 mingw-w64 toolchain 和 cmake ninja5. 将 toolchain 加入系统环境变量 2. 设置 vscode1. 必要的插件2. 一个简单的 vscode cmake 项目 最后C数据结构与算法CMake 前言 网上关于使用 vscode 配…

【计算机网络】网络原理

目录 1.网络的发展 2.协议 3.OSI七层网络模型 4.TCP/IP五层网络模型及作用 5.经典面试题 6.封装和分用 发送方(封装) 接收方(分用) 1.网络的发展 路由器:路由指的是最佳路径的选择。一般家用的是5个网口,1个WAN口4个LAN口(口:端口)。可…

如何修改运行中的docker容器的端口映射

一、必须先关闭docker服务 systemctl stop docker二、修改容器的hostconfig.json 文件 路径:vim /var/lib/docker/containers/容器id/hostconfig.json 修改 PortBindings 属性,如下图: 然后保存 三、修改config.v2.json 文件 路径&#…

[机缘参悟-110] :一个IT人对面具的理解:职业面具戴久了,就会忘记原本真实的自己,一个人是忠于职位,还是忠于内心?

目录 一、职业面具戴久了,就会忘记原本真实的自己 二、霸王别姬 三、没有对错,各走各路 3.1 程蝶衣:戏里戏外,忠于角色 3.2 段小楼:戏里戏外,角色分明 3.3 没有对错,各走各路 四、职场中…

Linux文件管理与用户管理

一、查看文件内容 1、回顾之前的命令 cat命令、tac命令、head命令、tail命令、扩展:tail -f动态查看一个文件的内容 2、more分屏显示文件内容(了解) 基本语法: # more 文件名称 特别注意:more命令在加载文件时并不…

本地安装telepresence,访问K8S集群 Mac(m1) 非管理員

kubeconfig 一.安装telepresence 1.安装 Telepresence Quickstart | Telepresence (1)brew install datawire/blackbird/telepresence 2.配置 目录kubectl 将使用默认的 kubeconfig 文件:$HOME/.kube/config 创建文件夹&…

分享一个比对图片是否一致的小工具(来源: github)

运行效果图: 官网: GitHub - codingfishman/image-diff: 一个方便的图片对比工具一个方便的图片对比工具. Contribute to codingfishman/image-diff development by creating an account on GitHub.https://github.com/codingfishman/image-diff 优缺点: 1.采用比对各色块是…

idea 里 没有svn选项的处理办法

总结一下没有svn选项的几种情况: 情况1:IntelliJ IDEA打开带SVN信息的项目不显示SVN信息,项目右键SVN以及图标还有Changes都不显示解决方法 在VCS菜单中有个开关,叫Enabled Version Control Integration,在打开的窗口…

ZY Player:影视爱好者的万能播放器

如果你是一位影视爱好者,一定有过为寻找一款支持各种影视资源、能解析VIP权限的播放器而头疼的经历。今天,我要为大家介绍一款被称为万能影视资源播放器的ZY Player,它由网友Hiram-Wong二次开发,并且是开源免费的 导航 强大的影视…

基于Java的旅游网站系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding) 代码参考数据库参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师、全栈领域优质创作者&am…

数据模型设计必读方法论!很实用

数据架构的重要构件之一是数据模型,当然从数据架构的视角来说的数据模型是指企业级数据模型。本篇文章更多是讨论如何设计和管理数据模型,此处的数据模型是泛指在组织中通过数据建模的过程,来发现、分析和确定数据需求范围,并用于…

分享Java NET Python三大技术下AutojsPro7云控代码

引言 有图有真相,那短视频就更是真相了。下面是三大语言的短视频。 Java源码版云控示例: Java源码版云控示例在线视频 Net源码版云控示例: Net源码版云控示例在线视频亚丁号-知识付费平台 支付后可见 扫码付费可见 Python源码版云控示例&…

彻底理解操作系统与内核的区别!

通用底盘技术 Canoo公司有一项核心技术专利,这就是它们的通用电动底盘技术,长得是这个样子,非常像一个滑板: 这个带轮子、有电池、能动的滑板已经包含了一辆车最核心的组件,差的就是一个外壳。这个看起来像滑板的东西…