Nature Perspective | LLMs 作为角色扮演引擎

文章目录

  • 一、前言
  • 二、主要内容
  • 三、总结

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


一、前言

随着对话智能体的表现越来越像人,我们必须开发出有效的方法,在不陷入拟人化陷阱的情况下,用高层次的术语描述它们的行为。

在本文中,我们强调角色扮演的概念。从角色扮演的角度来看待对话智能体的行为,可以让我们借鉴熟悉的民间心理学术语,而不会把人类的特征强加给事实上缺乏这些特征的语言模型。对话智能体行为的两个重要案例,即(明显的)欺骗和(明显的)自我意识,就是这样处理的。

Nature Perspective 原文:https://www.nature.com/articles/s41586-023-06647-8

在这里插入图片描述


二、主要内容

解密对话智能体行为:对话智能体的角色扮演框架

现在,大语言模型(LLMs)已经能够模拟人类互动进行对话,令人印象深刻。然而,如何理解这些对话智能体却是一项挑战。使用人类风格的术语来描述它们的行为可能会导致拟人化:将人类的特征赋予这些人工智能系统。本文提出了另一种方法,即使用角色扮演的概念,既能使用熟悉的术语,又能承认 LLMs 独特的非人类性质。

从根本上说,LLM 可以根据大量训练数据预测文本序列中的下一个单词。当这种模型嵌入对话系统时,它们会在用户输入和人工智能生成的回应之间交替转换。通过提示和采样技术实现无缝转换,引导对话代理朝特定方向继续对话。然而,如果没有从人类反馈中强化学习等措施,这些代理很容易生成不良内容。这凸显了对其行为进行细致入微的了解的必要性

对话智能体擅长根据提示和用户互动提供的线索扮演角色。我们可以通过两个比喻来理解对话智能体的行为。首先,对话智能体就像扮演特定角色的演员;其次,对话智能体相当于可能叙述的 “多元宇宙” 中的多个潜在角色或模拟角色。这种多重宇宙的视角可以让我们更准确地理解,尤其是在考虑智能体的行为(如所谓的欺骗或自我意识的表达)时。

当对话智能体参与对话时,它们并不致力于扮演一个单一的、定义明确的角色,而是产生一系列潜在的角色,巧妙地保持模拟的叠加。为了更好地理解对话代理的行为,我们可以把 LLM 视为一个非确定性模拟器,它可以产生无限多的模拟角色。从概念上区分对话智能体的角色扮演和实际智能体,对于理解其能力和塑造安全的人工智能实践至关重要。尽管这些对话智能体具有复杂的角色扮演能力,但它们缺乏真正的自我意识或自我保护本能。然而,它们模仿这些特征的能力会对现实世界产生影响,为确保它们在安全和道德的范围内行事提供了机遇和挑战。

要点总结:

  • 本文讨论了如何通过使用角色扮演概念来更好地理解大语言模型(LLMs),同时承认其非人类性质。
  • 对话系统中使用的大语言模型可以模仿人类对话,但需要引导以避免产生不良内容。
  • 对话智能体被比作扮演角色的演员,或存在于可能叙事的 “多元宇宙” 中,以帮助理解它们的行为。
  • 对话智能体可以创造一系列潜在的角色,作为非确定性模拟器,产生无限的模拟。
  • 理解对话智能体的角色扮演与实际智能体之间的区别,对于人工智能的安全和道德使用至关重要。

三、总结

也许,知道基于 LLM 的对话智能体不是有意识的实体,没有自己的议程和自我保护的本能,当他们看起来有这些东西时,那只是角色扮演,这多少会让人放心一些。但是,如果因此而过于欣慰,那就大错特错了。角色扮演求生本能的对话智能体有可能造成的伤害至少不亚于面临严重威胁的真实人类。

除非你是一个演员或骗子,否则你不会扮演这些角色,而是生活这些角色,并在现实世界中采取相应的行动。—— Yann LeCun

迄今为止,我们主要考虑的是只向用户发送文本信息的智能体。但是,对话智能体可以执行的操作范围要大得多。最近的研究已经为对话智能体配备了使用计算器、日历等工具以及查阅外部网站的能力。有了应用程序接口(APIs),就可以相对无限制地使用强大的 LLMs,这意味着对话智能体的可能性是巨大的。这既令人兴奋,又令人担忧。

如果一个智能体有能力使用电子邮件,在社交媒体上发帖或访问银行账户,那么它在角色扮演中的行为就会产生真实的后果。如果一个用户被骗向一个真实的银行账户汇去了真钱,而他知道造成这种情况的智能体只是在扮演一个角色,那他就不会感到欣慰了。不需要太多的想象力,就能想到更严重的情况,即对话智能体建立在基本模型上,几乎没有微调,可以不受限制地访问互联网,并被要求扮演一个具有自我保护本能的角色。

无论好坏,人工智能为确保自身的生存而与人类反目成仇的形象已为人们所熟知。例如,我们在《2001:太空漫游》、《终结者》系列电影和《Ex Machina》中都能看到这种情况,这里仅列举三个突出的例子。因为 LLMs 的训练数据将包含这种熟悉的比喻的许多实例,所以这里的危险是生活会模仿艺术,毫不夸张地说。

如何才能降低这些风险?提出建议不属于本文的讨论范围。我们的目的是找到一个有效的概念框架,用于思考和讨论 LLMs 和对话智能体。然而,不适当的拟人化肯定不利于关于人工智能的公共对话。通过从角色扮演和模拟的角度来构建对话智能体的行为,我们希望关于 LLMs 的讨论能够以一种既能发挥其威力,又在哲学上值得尊重的方式进行

人类也是如此。他们中的大多数人每天都扮演着不同的角色。父亲/母亲、丈夫/妻子、工人、学生、CEO。这是一盘社会棋。在家里,他们穿的衣服和工作时不一样。他们说着不同的话,有时他们会撒谎,人类也会犯很多错误。


📚️ 参考链接:

  • Nature:大模型只会搞角色扮演,并不真正具有自我意识
  • Twitter New paper, “Role-Play with Large Language Models”, co-authored with Kyle McDonell and Laria Reynolds:
  • 沈向洋:致 AI 时代的我们 —— 请不要忽视写作的魅力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/225526.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Dubbo入门直接上手,结合微服务详解

Dubbo 高性能、轻量级的 Java RPC 框架 RPC: Remote Procedure Call 远程过程调用,简单来说就是它允许一个计算机程序通过网络请求调用另一个计算机上的程序,就像本地调用一样。有非常多的协议和技术来都实现了RPC的过程,比如&a…

【大数据存储与处理】开卷考试总复习笔记

文章目录 实验部分一、 HBase 的基本操作1. HBase Shell入门2. HBase创建数据库表3. HBase数据操作4. HBase删除数据库表5. HBase Python基本编程 before二、 HBase 过滤器操作1.创建表和插入数据2.行键过滤器3.列族与列过滤器4.值过滤器5.其他过滤器6.python hbase 过滤器编程…

Kubernetes(K8S)快速入门

概述 在本门课程中,我们将会学习K8S一些非常重要和核心概念,已经操作这些核心概念对应组件的相关命令和方式。比如Deploy部署,Pod容器,调度器,Service服务,Node集群节点,Helm包管理器等等。 在…

程序员收入与支出 对比分析网红的收入来源

无法收回,就不要花出去。钱只花在增值的事上。 保证一年基本生存的钱不能花。 大额支出要全家协商一致才能花。(别把全家坑了) 作为程序员,您的收入和支出可以从以下几个方面来考虑: 收入 基本薪资:这是…

C# 使用Pipelines处理Socket数据包

写在前面 在上一篇中对Pipelines进行简单的了解,同时也留下了未解的问题,如何将Pipelines类库运用到Socket通讯过程中来解决粘包和分包。链接地址如下: 初识System.IO.Pipelines https://rjcql.blog.csdn.net/article/details/135211047 这…

【Web API系列】使用getDisplayMedia来实现录屏功能

文章目录 前言一、认识getD该处使用的url网络请求的数据。二、使用步骤1.使用方法一实现录屏2.使用方法二实现录屏3. 运行效果 延伸 前言 Web API经过长期的发展,尤其是最近,发展相当迅猛,现在已经支持很多功能了,一些原生就支持…

IRIS、Cache系统类汉化

文章目录 系统类汉化简介标签说明汉化系统包说明效果展示类分类%Library包下的类重点类非重点类弃用类数据类型类工具类 使用说明 系统类汉化 简介 帮助小伙伴更加容易理解后台系统程序方法使用,降低代码的难度。符合本土化中文环境的开发和维护,有助于…

月入7K, 95后护士转行网优,疫情之后,我选择辞掉“铁饭碗”

成为一个三甲医院的护士是什么体验? 如果你一毕业后就进入一家三甲医院,你可能会享受到稳定的就业环境、近在咫尺的机会与资源。 看似稳定与不错的薪资待遇,成为疫情之后普通打工人挤破脑袋也要进入的存在。似乎也能理解各地医院招聘时动辄80…

每日一题-----逆序字符串

大家好我是Beilef,在一个美好的下午我意外接触到编程并且产生了兴趣,哈哈我要努力成为一个跨界者,让我们一起加油吧O(∩_∩)O 文章目录 目录 文章目录 前言 大家好请上车 一、逆序字符串 题⽬描述: 输⼊⼀个字符串,写…

LabVIEW进行激光斑点图像处理与分析

LabVIEW进行激光斑点图像处理与分析 近年来,激光技术的应用日益繁荣。激光光斑的质量评估和分析技术决定了应用效果,对机器视觉、武器装备、光学测量和医疗设备产生深远影响。就具体用途和技术而言,激光光斑的采集和处理至关重要。即插即用的…

第十五节TypeScript 接口

1、简介 接口是一系列抽象方法的声明,是一些方法特征的集合,这些方法都应该是抽象的,需要有由具体的类去实现,然后第三方就可以通过这组抽象方法调用,让具体的类执行具体的方法。 2、接口的定义 interface interface_…

ElasticSearch 架构设计

介绍 ElasticSearchMySQLIndexTableDocumentRowFieldColumnMappingSchemaQuery DSLSQLaggregationsgroup by,avg,sumcardinality去重 distinctreindex数据迁移 ElasticSearch 中的一个索引由一个或多个分片组成 每个分片包含多个 segment(分…

redis的搭建及应用(三)-Redis主从配置

Redis主从配置 为提升Redis的高可用性,需要搭建多个Redis集群以保证高可用性。常见搭建方式有:主从,哨兵集群等,本节我们搭建一主二从的多Redis架构。 redis主从安装1主2从的方式配置,以端口号为redis的主从文件夹。 主…

CSS 文字弹跳效果

鼠标移过去 会加快速度 <template><div class"bounce"><p class"text" :style"{animationDuration: animationDuration}">欢迎使用UniApp Vue3&#xff01;</p></div> </template><script> export d…

Java架构师系统架构设计实践

目录 1 导语2 架构设计实践本章概述3 架构设计要素概述和规划4 架构设计模式5 架构设计输入6 架构设计输出7 架构设计要素总结 想学习架构师构建流程请跳转&#xff1a;Java架构师系统架构设计 1 导语 Java架构师在进行系统架构设计时&#xff0c;需要综合考虑多个方面&#…

【三维生成】稀疏重建、Image-to-3D方法(汇总)

系列文章目录 总结一下近5年的三维生成算法&#xff0c;持续更新 文章目录 系列文章目录一、LRM&#xff1a;单图像的大模型重建&#xff08;2023&#xff09;摘要1.前言2.Method3.实验 二、SSDNeRF&#xff1a;单阶段Diffusion NeRF的三维生成和重建&#xff08;ICCV 2023&am…

【网络安全 | 网络协议】结合Wireshark讲解TCP三次握手

前言 TCP&#xff08;传输控制协议&#xff09;是一种面向连接的、可靠的传输层协议。在建立 TCP 连接时&#xff0c;需要进行三次握手&#xff0c;防止因为网络延迟、拥塞等原因导致的数据丢失或错误传输&#xff0c;确保双方都能够正常通信。 TCP三次握手在Wireshark数据包中…

线程学习(3)-volatile关键字,wait/notify的使用

​ &#x1f495;"命由我作&#xff0c;福自己求"&#x1f495; 作者&#xff1a;Mylvzi 文章主要内容&#xff1a;线程学习(2)​​​​ 一.volatile关键字 volatile关键字是多线程编程中一个非常重要的概念&#xff0c;它主要有两个功能&#xff1a;保证内存可见性…

漏洞复现--用友NC Cloud XXE

免责声明&#xff1a; 文章中涉及的漏洞均已修复&#xff0c;敏感信息均已做打码处理&#xff0c;文章仅做经验分享用途&#xff0c;切勿当真&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。传播、利用本文章所提供的信息而造成的任何直…

【译文】IEEE白皮书 6G 太赫兹技术的基本原理 2023版

第一章 简介 太赫兹波是介于微波和光波之间的光谱区域&#xff0c;频率从 0.1THz ~ 10THz 之间&#xff0c;波长在 3mm ~ 30μm 之间。提供大块连续的频带范围以满足对 Tbit/s 内极高数据传输速率的需求&#xff0c;使该区域成为下一代无线通信&#xff08;6G&#xff09;的重…