让ChatGPT长“手”!Meta爆火新论文,让语言模型学会自主使用工具

鱼羊 Pine 发自 凹非寺
量子位 | 公众号 QbitAI

ChatGPT爆火,Meta也坐不住了。

微软和谷歌正在搜索引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,顿时吸引全场目光:

瞄准ChatGPT的“软肋”,让大语言模型自行学会了使用工具

95836cf27a513d6750cbd1d919b8bb13.jpeg

简单来说,基于Meta的这个思路,ChatGPT这些大语言模型可以缺啥补啥:

不会算数,就自己掏出计算器计算;需要最新信息,就自己连接搜索引擎搜索……

3100529f74dc16b1588f0312053402b8.gif

是不是有点AI自己操作自己内味儿了?

论文一出,不少AI研究者就将其视作“过去几周里最重要的论文”。

880f3fde2dc3fbc7d17f4021d268d339.png

这篇论文给人们打开了思路,让大语言模型未来可以成为所有事情的起点。

ed1c631bca2fadf04128f48b87d3f746.png

还有网友表示:我老婆原本不太关心AI,听说Meta这论文都惊了。普通人真的得好好想想这事儿了。

46e67cb2676098ece508736801635b7c.png

自学工具用法的大语言模型

这一回,Meta给这个会使工具的语言模型起名Toolformer

Toolformer的内核逻辑,总结下来很简单,就是:

专业的任务交给专业的工具来做

在生成文本的过程中,遇到特定的任务,Toolformer会直接调用所需工具的API。

比如说,在执行这个任务:1400名参与者,有400人通过了测试,占多大比例?(为了让ChatGPT掌握数学运算,OpenAI可没少折腾,详见量子位:ChatGPT连夜迭代:你老婆不好使了)

Toolformer丝毫不慌,直接“掏出”计算器,现场计算得出结果:29%

db7fccf84b569188f065409db1fbddfb.gif

又或者说,想要备注个事情,只知道是周五,具体日期还不知道?

没关系,翻出日历查一下就好了。

f05e5960c154f7a7909e33f0600cf3d9.gif

甚至翻译任务也可以直接丢给它,各国语言都能够识别并翻译,直接省去了在软件切换语言的工夫。

61e5c03f43e844ececc8cd956e4b10aa.gif

除了这些工具之外,Toolformer还能够调用Q&A以及搜索引擎等工具。

76a76cffd7114536bff848e478c12ab9.png

这时,就已经有网友开始畅想未来了:

现在,ChatGPT版必应能帮你比较酒店价格,那未来有了Toolformer,预定性价比高的酒店岂不是也可以甩给AI去做了。

c78c43c67ce21335168d068e4739c12e.png

不过话说回来,Toolformer面对不同的任务都能行云流水般地调用对应的工具,它是怎么做到的呢?

一言以蔽之,Toolformer经过训练,能够在生成文本中插入API调用,直接将任务外包出去。

在这其中,训练的过程是以自监督的方式完成的。这意味着无需大量人类标注好的数据,Toolformer只需要少量演示就能学会调用API。

具体来说,先给Toolformer提供少量已经手动标注好的例子,然后让语言模型在实践中生成一个更大的包含示例的数据集

这个过程主要分成三步:

首先是取样,通俗点讲就是看输入的文本提示中,哪个地方需要调用哪种工具,然后直接将“调用的API”插入到对应的地方;

dfdbccc6ec5de625cf91fe5390786898.png

其次是执行,执行上一步的“调用API”任务,将生成的文本直接插入进去;

最后是过滤,上一步中工具生成的文本如果对输入文本来说用处不大的话,就可以直接pass掉,保留对文本有用的地方。

92fc7e3e3c891a67dd9e657a3f84ee47.png

这样一来,基于这些有用的数据集,Toolformer便可以对预先训练好的大语言模型进行微调。

讲了这么多,Toolformer的真实效果到底如何,有没有一个横向的数据对比?

论文将Toolformer和多个其他大语言模型,包括GPT-J,OPT(66B)以及GPT-3(175B)进行了对比,比较了它们在数学、Q&A以及机器翻译等方面的能力。

结果显示,在学习使用工具后,GPT-J的零样本学习性能的到了显著的提高。

e06c3027ace840a636c573dbf48edde2.png

Toolformer:是在GPT- J上微调,并加强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用

并且在大多数任务上性能都有明显提高,在一些下游任务中Toolformer甚至已经超过了GPT-3。

4e9d5c425ee1824383cd3938c733122c.png

“未来大语言模型发展的重要分支”

说到这里,不知道你怎么看这件事儿。

有不少网友是已经按捺不住,想着去拔AI电源了。

78e4dd59454bda3de3a272e6da0402a2.png

而引发更多讨论的,是这样一种观点:Toolformer可能是未来LLM(大语言模型)发展的一个重要分支。

f7ee15eb3c6eae1ab0207653ad0fa711.png

大语言模型进化出使用工具的能力,知道应该在何时、使用何种工具来实现需求,也就意味着许多在今天还需要人类和AI协作完成的工作,未来AI都能自己搞定了。

比如现在还多少有些“人工智障”的语音助手,如果背后有ChatGPT+Toolformer的技术能力支撑,那么从挑选符合需求的餐厅,到直接订座,这一系列动作都可以被丝滑地串联起来。

又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI,那它不仅能帮人们完成搜索,还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。

甚至,ChatGPT这样的模型,借助各种API重写自己的代码,也将成为可能。

9a6a1a60d68f5299d36fe466bf82d30c.png

事实上,让AI掌握工具的使用方法这个研究方向,也并不只有Meta在做。

比如谷歌即将嵌入到搜索中的Bard,背后模型LaMDA就内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。

还有开源项目LangChain,也致力于将大语言模型与外部的计算、知识来源相结合,以开发真正可用的应用程序。

而现在,Meta又使大模型对工具的使用“熟练度”、“自主性”,更上一层楼。

不过,也有网友指出,Toolformer所展现出的“自学”能力,还是一个初级、“狭义”的版本。

这些模型本身仍然是纯粹的函数:给定相同的输入(包括采样时的随机值),它将总是产生相同的输出。
有点像是在说,一个大语言模型能学会将特定领域的语言作为其自然语言的一部分,以此纳入来自外部工具的知识。

202eca70d17e578c11e2df50e139bedf.png

One More Thing

Meta新论文炸场,还挑动了人类的“反思”神经。

这不,新鲜梗图已经出炉:

人类在沉迷,而机器在学习。

43095e32a3c9b82aa74cdfd00cd53339.png

论文地址:
https://arxiv.org/abs/2302.04761
参考链接:
[1] https://twitter.com/timo_schick/status/1624058382142345216
[2] https://twitter.com/mathemagic1an/status/1624870248221663232
[3] https://twitter.com/Tisoga/status/1624543837745192960

《中国AIGC产业全景报告暨AIGC 50》调研启动

谁会是中国的“ChatGPT”?最有竞争力和潜力的AIGC力量位于何方?

量子位《中国AIGC产业全景报暨AIGC 50》正式启动对外征集,期待有更多优秀的机构、产品、案例与技术能够被大众看到。

5dd15a87f4da87446c070a35aed3d5c0.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8402.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 何以掀翻 Google 布局多年的AI大棋?

来源: 飞哥说AI 作者|高佳 创意|李志飞 任何大卫击败歌利亚的故事, 都值得我们重新思考。 2023年从一场巨头之间的巨额合作开始,一场汹涌已久的AI暗战摆上了台面。 随着微软和 OpenAI 融资的推进,双方…

AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略

AIGC之GPT-4:GPT-4的简介(核心原理/意义/亮点/技术点/缺点/使用建议)、使用方法、案例应用(计算能力/代码能力/看图能力等)之详细攻略 解读:在2022年11月横空出世的ChatGPT,打遍天下无敌手的时候,就知道会有这么一天,知…

宇宙最强-GPT-4 横空出世:最先进、更安全、更有用

文章目录 前言一、准确性提升1.创造力2.视觉输入3.更长的上下文 二、相比于ChatGPT有哪些提升1.GPT-4 的高级推理能力超越了 ChatGPT2.GPT-4 在多种测试考试中均优于 ChatGPT。 三、研究团队在GPT-4模型都做了哪些改善1.遵循 GPT、GPT-2 和 GPT-3 的研究路径2.我们花了 6 个月的…

ChatGPT五分钟写完插件,功能完善,还可加需求改BUG

开发者(KaiFaX) 面向全栈工程师的开发者 专注于前端、Java/Python/Go/PHP的技术社区 詹士 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT写代码,水平究竟如何? 不到5分钟,做出一个WordPress(一款内容管理系统…

ChatGPT无限可能性:自然语言生成的奥秘

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ! ChatGPT无限可能性:自然语言生成的奥秘 数字化时代:跨越语言和文化障碍 冰岛是北大西洋中部的一个岛国,拥有充满活力的科技产业和…

太香了!用chatGPT写正则

chatGPT热度一直持续不下,我们普通人能做什么? 当然是先用起来,和自己工作结合起来,提高效率。 日常工作中正则使用少不了,可以让gpt来写正则,再也不用去小度查了。 今天推荐下朋友开发的gpt 正则工具&…

一个评测模型+10个问题,摸清盘古、通义千问、文心一言、ChatGPT的“家底”!...

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 毫无疑问,全球已经在进行大模型的军备竞赛了,“有头有脸”的科技巨头都不会缺席。昨天阿里巴巴内测了通义千问,今天华为公布了盘古大模型的最新进展。不久前百度公布了文心一言、360也公布…

【前沿技术】问答pk【ChatGPT Vs Notion AI Vs BAT AI 】

目录 写在前面 问题: 1 ChatGPT 1.1 截图 ​1.2 文字版 2 Notion AI 2.1 截图 2.2 文字版 3 BAT AI 3.1 截图 3.2 文字版 总结 序言 所有幸运和巧合的事,要么是上天注定,要么是一个人偷偷的在努力。 突发奇想,问三个…

前京东AI掌门人周伯文入局ChatGPT,亲手创立的衔远科技获天使轮融资数亿元!

日前,全球领先的专注于企业创新数智化的技术服务公司衔远科技宣布已经完成数亿元天使轮融资,本轮融资由启明创投领投,经纬创投跟投。 衔远科技成立于2021年底,致力于让每一件商品都应需而生,让每一位消费者都得偿所愿。…

前京东AI掌门人入局ChatGPT!「不设上限」招揽中国OpenAI合伙人

鱼羊 发自 凹非寺量子位 | 公众号 QbitAI4 又一技术大牛官宣入局ChatGPT。 这一回出手的,是被视作“京东AI开创者”的前京东高级副总裁,周伯文。 就在2月26日晚间,周伯文在朋友圈广发“英雄帖”,称“现不设上限诚招合伙人”&#…

AI落地:程序员如何用AI?

对于程序员来说,真正能提高效率、可落地的AI应用场景都有哪些? 目前已经能切实落地,融入我日常工作生活的有以下几个场景: 开发工作:自然语言生成代码,自动补全代码 日常工作学习:写作、翻译、…

我的周刊(第079期)

我的信息周刊,记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 🎯 项目 ChatGPT 项目推荐 基于 ChatGPT 相关接口衍生的项…

中小学教师ChatGPT的23种用法!

中小学教师ChatGPT的23种用法! 近日,ChatGPT引发舆论风暴,火遍全球。作为一款生成式人工智能软件,ChatGPT可以就任何议题生成文本,完成包括回答问题,撰写文章、论文、诗歌在内的多种工作。各界盛赞其“有着…

【软件架构思想系列】分层架构

目录 架构思维概述 “分解+集成” 可以理解为架构最核心的思考方式和方法。

K8S 生态周报| 别慌,DockerHub 不会清退开源组织和开源项目

“ 「K8S 生态周报」内容主要包含我所接触到的 K8S 生态相关的每周值得推荐的一些信息。欢迎订阅知乎专栏「k8s生态」[1]。 ” 大家好,我是张晋涛。 DockerHub 将停止个人免费版 Team 的功能 想必很多人都用过 DockerHub,Docker 刚面世的时候&#xff0c…

ChatGPT,太爆了!

大家好啊,我是了不起,一个热爱开源的程序员~ 自从去年 ChatGPT 刚刚推出的时候,我们团队就上手体验过,当时就让我感觉到非常的震惊:使用好她,绝对能将工作效率提升好几倍! 这是当时做的几个小测…

AIGC技术周报|清华、北邮新研究:让文生图AI更懂你

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及DallE 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。 OpenAGI:当大模型遇见领域专家 “愿原力与大型…

2022.2.26 第十五次周报

文章目录 前言一、论文阅读《Interactive Learning from Policy-Dependent Human Feedback》摘要IntroductionRelated WorkPolicy-dependent反馈Convergent Actor-Critic by Humans (COACH)The Advantage Function and FeedbackConvergence and Update Rule ExperimentConclusi…

大模型论文周报 | 来自MIT、哥伦比亚大学、港科大、斯坦福、普林斯顿大学等机构前沿论文研究...

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 大模型又可以称为Foundation Model模型,模型通过亿级的语料或者图像进行知识抽取,学习进而生产了亿级参数的大模型。大模型的出现迎来了AI研究的新时代,其所带来的结果提升十…

AIGC技术周报|ChatDoctor:哪里不舒服;HuggingGPT:连接大模型和机器学习社区;ChatGPT真的鲁棒吗?

AIGC通过借鉴现有的、人类创造的内容来快速完成内容创作。ChatGPT、Bard等AI聊天机器人以及DallE 2、Stable Diffusion等文生图模型都属于AIGC的典型案例。「AIGC技术周报」将为你带来最新的paper、博客等前瞻性研究。 1.ChatDoctor:哪里不舒服? 通用领…