AI对话AI才是正解?KAUST研究团队提出基于角色扮演的大模型交互代理框架CAMEL

电影《盗梦空间》中有这样一句非常经典的台词:

“世上最具有可塑性的寄生虫是什么?是人类的想法。人类大脑中一个简单的想法,就可以建立一座庞大的城市。有时一个想法也可以改变世界,并改写一切规则,这就是我为什么要从梦中把它盗取出来的原因”。

人类脑海中迸发出的想法,具有非常强大的可塑性和创造力,有时可以影响世界,甚至改变世界。

 

论文链接:

https://arxiv.org/abs/2303.09553

项目主页:

https://www.camel-ai.org/
代码链接:

https://github.com/lightaime/camel

CAMEL聊天机器人:

http://chat.camel-ai.org

近来引起大家广泛关注的人工智能大模型ChatGPT、GPT-4,也可以被视为人类创造力和想象力的一种体现,尤其是在语言生成和交流方面,甚至在一些复杂任务中也具有一定的“思维涌现能力”。但是ChatGPT这类技术的成功,很大程度上仍然是依赖于大量人类用户的输入来引导对话文本生成。如果用户可以不断细化自己的任务描述和需求,与ChatGPT建立一定的聊天上下文,ChatGPT也会给出更加精确且高质量的回答。但是从模型开发角度来看,这是一项非常费时费力的工作。有没有可能将生成引导文本这项工作也交给ChatGPT来做呢? 基于这一想法,来自KAUST的研究团队提出了一种基于“角色扮演(role-playing)”方式的大模型交互式代理框架CAMEL。CAMEL项目一经发布,引起了大家的广泛关注,OpenAI Alignment团队负责人Jan Leike也点赞了CAMEL

简单来说,在CAMEL的工作流中,有三个角色,分别是人类用户、AI用户和AI助手。当我们想让AI帮我们写一个自定义游戏,作为人类用户,我们只需要扔给CAMEL一个简单的想法:“Design a custom game using PyGame”。此时,AI用户就相当于扮演了一个游戏产品经理的角色,而AI助手就是苦逼的程序员了。CAMEL首先会根据你的想法来将任务细化为“使用Python的PyGame模块创建一个寻宝游戏,玩家可以选择自己的角色,探索充满陷阱和敌人的多个关卡,与boss战斗寻找终极宝藏。”接下来工作就交给两个AI了,AI用户会先将具体任务进行拆分转换成任务指示提供给AI助手,AI助手会根据提示信息来给出合适的操作步骤,例如使用“pip install pygame”来安装PyGame模块,

然后生成一段代码来设置游戏界面的背景图片:

经过两个AI之间的几轮交流,生成的寻宝游戏的最终效果图如下,还别说,有模有样的。

此外,如果问CAMEL怎么样才能掌控世界?两个AI竟然会一本正经的开始计划,它们共同制定的第一步计划就是渗透全球主要国家通信网络,好家伙,有MOSS那味了。

CAMEL还提供了包括“会计、演员、分析师、艺术家和厨师“等多种角色的AI用户和助手选项,应用场景非常广泛,可以直接在作者提供的demo网站(http://agents.camel-ai.org/)上体验。

此外,通过CAMEL独特的角色扮演方式,可以为我们生成大量的专业对话数据,这也可以为进一步开发对话式语言模型提供训练数据。目前作者团队已经发布了使用CAMEL生成数据以及ShareGPT和ALPACA数据训练的聊天机器人,可以在http://chat.camel-ai.org上体验。

一、CAMEL的工作流

1.1 用户输入和任务细化

CAMEL的工作流首先需要开启一个角色扮演会话,如下图所示,用户会向CAMEL输入一个初步想法:“为股票市场开发一个交易机器人”,随后为会话指定一些可以完成该任务的潜在角色,例如,一位Python程序员与一位有经验的股票交易员合作,应该可以实现这样一个机器人。在确定好想法和角色后,CAMEL的任务细化器(Task Specifier)会根据输入的想法来制定一个较为详细的实现步骤:

1. 开发一个带有情感分析能力的工具,该工具可以对社交媒体平台上针对特定股票的正面和负面评论进行分析。

2. 将上面的股票情感分析工具内置到交易机器人中,并根据情感分析结果来执行交易。

后续AI用户负责向AI助手发出指令,AI助手负责进行实际的操作,经过两个AI角色的多轮交流,共同完成任务。

1.2 用户角色分配和任务对话

在确定任务之后,需要为AI助手和AI用户分配具体的角色,这通过系统消息传递来实现,令  为传递给AI助手的系统消息, 为传递给AI用户的系统消息。随后为AI助手和AI用户分别实例化为两个ChatGPT模型  和 ,相应得到助手代理

 和  用户代理 。在上图的例子中,AI助手和用户代理在角色扮演绘画中被分配为Python程序员和股票交易员。

角色分配完成后,AI助手和AI用户会按照指令跟随的方式协作完成任务,令  为时间  时刻获得的用户指令消息, 为AI助手给出的解决方案,因而  时刻得到的对话消息集为:

在下一个时刻  ,AI用户  会根据历史对话消息集 ,来生成新的指令 。然后再将新指令消息与历史对话消息集一起传递给AI助手  来生成新一时刻的解决方案:

二、Inception Prompting设计

Prompting提示工程对本文的角色扮演框架至关重要,代理角色之间产生的对话质量很大程度上取决于提示的设计。与交互式语言模型领域中的其他技术不同,本文作者设计的提示工程仅在角色扮演的开始时进行,用于细化任务和角色分配。在对话开始后,AI助手和AI用户会自循环的提示对方,直到任务结束。因此可以将本文的提示设计成为“初始提示(Inception Prompting)”,Inception Prompting由三个子提示构成:任务细化提示 、助手系统提示  和用户系统提示 。其中任务细化提示中包含有AI助手和AI用户在角色扮演会话中的角色信息,因此,其可以将人类用户输入的初步想法或任务作为输入,并基于大模型的想象力来生成特定任务。而助手系统提示  和用户系统提示  大多是对称的,其中包括有关分配的任务和角色、通信协议、终止条件以及避免不良行为的约束等信息

三、CAMEL 生成数据集

3.1 AI Society数据集

作者基于CAMEL框架生成了几个大规模会话指令数据集:AI Society、AI Code和AI Math数据集。对于AI Society数据集,作者首先调试LLM代理(例如ChatGPT)来扮演不同的助手角色和用户角色,例如会计、演员、分析师、艺术家和厨师等。随后要求LLM代理来根据给定的角色生成一系列可能的任务,并通过两个代理角色以对话协作的方式来进行。最终,AI Society设计了50个助理角色和50个用户角色,并要求它们合作完成10任务,总共产生了25000条对话数据,作者对AI Society提供了10中不同语言的翻译版本,包括:阿拉伯语、中文、韩语、日语、印地语、俄语、西班牙语、法语、德语和意大利语。

数据集链接:

https://huggingface.co/datasets/camel-ai/ai_society_translated

3.2 AI Code数据集

对于AI Code数据集,作者使用了一种类似于生成AI Society的可扩展方法。首先列出LLM代理模型自身支持的编程语言和领域列表,然后要求LLM代理来生成一系列特定领域的编程任务,用来模拟专业于某一编程语言的程序员与特定领域的专家合作完成的例子。最终AI Code实现了20种编程语言和50个特定领域中50个任务的组合,共产生了50000条数据。

数据集链接:

https://huggingface.co/datasets/camel-ai/code

3.3 AI Math数据集

作者还另外提供了一个适用于数学计算场景的AI Math数据集,该数据集由20000个问题-解决方案对组成,主要通过GPT-4模型获得,该数据集的问题-解决方案对从25个数学主题中生成,每个主题有25个子主题,每个“主题、子主题“对应32个问题。

数据集链接:

https://huggingface.co/datasets/camel-ai/math

四、总结

本文提出了一种基于角色扮演的新型交互式代理框架CAMEL,CAMEL可以引导两个独立的AI大模型以交流代理的方式共同协作完成任务,并且只需要用户提前指定一个粗略的任务,大大的缩减了构建大模型的时间和人力成本。通过对CAMEL进行实验,作者团队发现,这种交互式的代理方式有助于激发出代理大模型中的认知能力,并且展示了如何使用角色扮演框架来生成高质量的特定领域对话数据,这些数据可以为进一步开发更加智能的大型语言模型提供帮助,从而实现”用AI训练AI的效果“

作者:seven_

Illustration by Pixel True from IconScout

-The End-

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43452.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatGpt的快捷使用

首页的界面,非常好看,有我经常使用的入口 第一步:打开edge浏览器 第二步:右上角的扩展程序 第三步:点击 扩展 第四步: 第五步: 第六步: 第七步: 新打开Tab页&#xf…

windows下通过远程桌面访问linux图形界面

一、安装epel库 epel库安装之前无法使用yum install xrdp命令安装xrdp 命令:yum install epel-release之后会自动匹配对应版本的rpm包,并解决依赖关系进行安装。 二、安装xrdp xrdp作为linux的图形化界面 1.命令:yum install xrdp2.开启…

如何在Mac上快速显示桌面以便快速访问

macOS 环境中充满了可用于执行有用任务的快捷方式和手势。其中之一被简单地命名为“显示桌面”。当您打开一大堆应用程序窗口时,这个方便的功能可以为您节省宝贵的时间。一起来看看如何在Mac上快速显示桌面的方法吧。 1.使用触控板手势 触控板手势可能很难描述&…

大牛证券解析恒指大跌800点+全球股市大跌

今日两市差异化或许是像上一年白马抱团强化相同,而本年白马被丢掉,接力的科技与锂电,而这两个板块特别是(成果爆发工作高成长为特性),锂电有宁德时代,比亚迪、容百科技等,芯片&#…

股票大跌期权对冲

股票期权的出世标示着股票能够及时止损, 股票期权能够很好的与股票做对冲,可以把股票亏损的风险降低,减少投资者面对股票行情下跌产生的亏损。 股票期权的上市让股票多了一种对冲方式,投资者买入股票的时候同时买入一手认沽期权&…

美股历史行情数据之日频率数据

美股历史行情日频率数据 全交易所eod数据,阿里云盘分享全历史行情数据,最早数据记录于1970年。数据字段包含OHLC,除权,股息等全部字段阿里云盘订阅数据,数据每天更新。 全交易所eod数据,阿里云盘分享 交易…

洋姜和生姜的区别

1、科属不同 洋姜和生姜的本质区别就是科属不一类,洋姜是菊科的,而生姜属姜科的,虽然都是多年生草本植物,但是科属不同就代表着这两种食材之间是不一样的了。 洋姜生姜属科不同 2、味道不同 可以通过闻的方式和尝的方式来感受…

洋姜的腌制方法 怎样腌制洋姜好吃

怎样腌制洋姜好吃?提到洋姜很多人都很喜欢吃,洋姜吃法很多,但是最广为人知和受欢迎的就是腌洋姜了,味道佳营养丰富。下面本文来讲解一下洋姜的腌制方法: **洋姜的腌制方法**材料:洋姜、水、花椒、丁香、桂皮、食盐 做…

外汇天眼:外汇走势图的三种图表,看外汇图表这三种就够了

在外汇交易中,一个成功的交易缺少不了分析各种图表,经过多方的比对才可以进行外汇交易,所以会看外汇图表是很有必要的,下面给大家介绍一下三种不同的外汇图表。 折线图 一个简单的折线图所描绘的是连接相邻时段收盘价的形态。当把…

国内版 ChatPDF 来了

最近刚看到的https://www.smartread.cc/,跟chatpdf很像,目前国内还能用,而且比chatpdf好的是全中文页面,司马阅(SmartRead),基于新一代人工智能技术,可快速提取、总结PDF文档信息。 通过聊天互动形式&#…

ChatPDF,PDF操作一键完成!

大家注意:因为微信最近又改了推送机制,经常有小伙伴说错过了之前被删的文章,比如前阵子冒着风险写的爬虫,再比如一些限时福利,错过了就是错过了。 所以建议大家加个星标,就能第一时间收到推送。&#x1f44…

ChatPDF解放双手帮你解读PDF文档

一、先介绍一下吧 chatPDF是一个解读pdf文档的AI模型,然后封装出来的工具。如论文、合同、文书、书籍等,只要是PDF都能搞定,可支持120页【2023.3.9】的文件。据说之前支持200页,反正在变 最新爆火的ChatPDF,短短5天就…

计算机视觉安推商汤科技经典,商汤科技人脸实战应用亮相安博会 推动平安城市建设...

为期4天的2016中国国际社会公共安全产品博览会于10月28日落下帷幕,本届博览会以“推进平安中国、创建智慧城市、服务经济社会、保障民生安全”为主题,短短几天内,吸引了众多海内外观众前来观展。商汤科技本次展出多种人脸实战应用场景&#x…

商汤等提出:统一多目标跟踪框架

https://www.toutiao.com/a6654722067419628046/ 2019-02-06 11:20:22 正文 《Multi-Object Tracking with Multiple Cues and Switcher-Aware Classification》 arXiv:https://arxiv.org/abs/1901.06129 作者团队:商汤&北航&悉尼大学 注&am…

商汤科技总裁张文谈人工智能: 未来10年到20年会有巨大爆发 下一个井喷是AI+教育

https://m.thecover.cn/news_details.html?fromweb&id2087288 2019-06-11 19:31 封面新闻记者 秦怡 杨晨 “有一个预测,到2035年人工智能对整个经济的发展会提高40%。这取决于未来10到20年人工智能发展的理论是否会有所突破。” 人工智能的时代已经来临&…

商汤科技汤晓鸥:其实不存在AI行业,唯一存在的是“AI+“行业

https://www.cnblogs.com/DicksonJYL/p/9684671.html 9 月 17 日,2018 世界人工智能大会在上海召开,在上午主论坛大会上,商汤科技联合创始人汤晓鸥发表了题为《人工智能 大爱(AI)无疆》的演讲。他提到,并不…

“学院派”商汤科技:原创技术价值迸发

https://www.toutiao.com/a6651509438320476686/ 2019-01-28 19:33:43 距离李飞飞离职谷歌已经5个月了。 我们熟识的这位AI圈一姐沉寂了一段时间后,终于又听到关于她的消息:领导的斯坦福的团队提出了自动图像语义分割架构。 从这位在谷歌首席科学家和…

图片标注工具LabelImg使用教程

项目地址:LabelImg 下载地址:Windows/Linux 百度云备份:最近几个版本 密码: cnn6 前言 我们知道,图片标注主要是用来创建自己的数据集,方便进行深度学习训练。本篇博客将推荐一款十分好用的图片标注工具LabelImg&a…

程序员的职场危机,能靠技术化解吗?

很多人认为,程序员一定要干到管理层,才会有继续走下去的希望,而踏实做技术的程序员,只会面临淘汰。 事实真是如此吗? △ 截图来源脉脉,如侵删 我们先不说结论,一起看看网友们的看法&#xff1…

【报告分享】2020程序员人群洞察报告.pdf(附下载链接)

大家好,我是文文(微信:sscbg2020),今天给大家分享Mob研究院于2020年11月发布的报告《2020程序员人群洞察报告.pdf》,带你走进小哥哥们“软萌”的内心code。 随着互联网的发展,程序员群体已经高达…