一文读懂 ChatGPT 插件功能:语言模型获取新信息的“眼睛和耳朵”

cc68cfd4d079fa184e70d11332bbc6e2.gif

来源:OpenAI

编译:巴比特

641f66c38b12de64f49dfa70660448ef.jpeg

图片来源:由无界 AI工具生成

OpenAI:我们已经在 ChatGPT 中实现了对插件的初步支持。插件是专门为语言模型设计的工具,以安全为核心原则,并帮助 ChatGPT 访问最新的信息,运行计算,或使用第三方服务。

根据我们的迭代部署理念,我们正在逐步推出 ChatGPT 中的插件,以便我们能够研究它们在现实世界中的使用、影响以及安全和协调方面的挑战 -- 为了实现我们的使命,我们必须做好这些工作。

自从我们推出 ChatGPT 以来,用户一直在要求使用插件(许多开发者也在尝试类似的想法),因为它们可以释放大量可能的用例。我们正从一小部分用户开始,并计划在我们了解到更多信息后,逐步推出更大规模的访问(针对插件开发者、ChatGPT 用户,以及在 alpha 期之后,希望将插件整合到他们产品中的 API 用户)。我们很高兴能建立一个塑造未来人类与人工智能互动模式的社区。

从我们的候选名单中被邀请的插件开发人员可以使用我们的文档来构建 ChatGPT 插件,然后在显示给语言模型的提示中列出启用的插件,以及指导模型如何使用每个插件的文档。首批插件由 Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram 和 Zapier 创建。

330ea9fe8ea58fbbf56a2f8e5fc2aee7.png

我们自己也有两个插件,一个是网页浏览器,一个是代码解释器。我们还开源了一个知识库检索插件的代码,任何有信息的开发者都可以自行托管,以增强 ChatGPT 的功能。

今天,我们将开始向白名单上的用户和开发者提供该插件的 alpha 权限。虽然我们最初会优先考虑少数开发者和 ChatGPT Plus 用户,但我们计划随着时间的推移推出更大规模的访问。

01

概述

今天的语言模型,虽然对各种任务都很有用,但仍然是有限的。它们可以学习的唯一信息是它们的训练数据。这些信息可能是过时的,而且在各种应用中都是一刀切的。此外,语言模型唯一可以开箱即用的就是发出文本。这个文本可以包含有用的指令,但要真正遵循这些指令,你需要另一个过程。

虽然不是一个完美的比喻,但插件可以成为语言模型的“眼睛和耳朵”,让它们获得太新、太个人、太具体而无法包含在训练数据中的信息。为了响应用户的明确要求,插件也可以使语言模型代表其执行安全的、受限制的行动,从而提高系统的整体实用性。

我们期待开放标准的出现,以统一应用程序公开面向 AI 界面的方式。我们正在对这样一个标准进行早期尝试,正在寻找有兴趣与我们一起建设的开发者的反馈。

今天,我们开始逐步为 ChatGPT 用户启用我们早期合作者的现有插件,从 ChatGPT Plus 用户开始。另外,我们也开始允许开发人员为 ChatGPT 创建自己的插件。

在未来几个月,随着我们从部署中学习并继续改进我们的安全系统,我们将对这个协议进行迭代,我们计划让使用 OpenAI 模型的开发者将插件整合到他们自己的应用程序中,而不是 ChatGPT。

02

安全和更广泛的影响

将语言模型连接到外部工具,既带来了新的机遇,也带来了新的风险。

插件提供了解决与大型语言模型相关的各种挑战的潜力,包括“幻觉”,跟上最近的事件,以及(经许可)访问专有信息源。通过整合对外部数据的明确访问 -- 例如网上的最新信息、基于代码的计算或自定义插件检索的信息 -- 语言模型可以通过基于证据的参考来加强其反应。

这些参考资料不仅可以提高模型的效用,而且还可以使用户评估模型输出的可信度,并反复检查其准确性,从而有可能减轻与过度依赖有关的风险,正如我们最近在 GPT-4 系统卡中所讨论的。最后,插件的价值可能远远超出解决现有的限制,帮助用户完成各种新的用例,从浏览产品目录到预订航班或订购食物。

同时,风险是插件可能通过采取有害的或非预期的行动来增加安全挑战,增加那些会欺诈、误导或虐待他人的不良行为者的能力。通过增加可能的应用范围,插件可能会提高模型在新领域采取错误或不一致的行动所带来的负面影响的风险。从第一天起,这些因素就指导着我们的插件平台的发展,我们已经实施了一些保障措施。

我们已在内部并与外部合作者进行了红队测试练习(red-teaming exercises),发现了一些可能的相关情况。例如,我们的红队成员发现了插件的方法 -- 如果在没有保护措施的情况下发布,可以执行复杂的提示注入,发送欺诈性和垃圾邮件,绕过安全限制,或滥用发送到插件的信息。我们正在使用这些发现来告知设计安全缓解措施,以限制有风险的插件行为,并提高作为用户体验一部分的插件如何以及何时运作的透明度。我们还利用这些发现来决定逐步部署对插件的访问。

如果你对该领域的安全风险或缓解措施感兴趣,我们鼓励你参与我们的研究人员访问计划。我们还将邀请开发者和研究人员提交与插件相关的安全和能力评估,作为我们最近开源的 Evals 框架的一部分。

插件将可能产生广泛的社会影响。例如,我们最近发布了一份工作文件,发现可以使用工具的语言模型可能会比没有使用工具的语言模型产生更大的经济影响。更普遍的是,与其他研究人员的发现一致,我们预计当前的人工智能技术浪潮将对就业转型、转移和创造的速度产生很大影响。我们渴望与外部研究人员和我们的客户合作,研究这些影响。

03

Browsing(Alpha 阶段)

一个知道何时及如何浏览互联网的实验性模型。

受过去工作(我们自己的 WebGPT,以及 GopherCite、BlenderBot2、LaMDA2 等)的激励,允许语言模型从互联网上读取信息,严格扩展了它们可以讨论的内容的数量,超越了训练语料库,扩展到了当前的新鲜信息。

下面是 ChatGPT 用户的 Browsing 体验的一个例子。在此之前,若提出这些问题,模型会礼貌地指出它的训练数据没有包含足够的信息来让它回答。在这个例子中,ChatGPT 检索关于最新奥斯卡奖的最新信息,然后执行我们现在熟悉的 ChatGPT 诗歌表演,这是 Browsing 可以成为附加体验的一种方式。

1f418afab84a0ae20687cd165e9d64b2.png

除了为终端用户提供明显的效用外,我们认为使语言和聊天模型能够进行彻底和可解释的研究,在可扩展对齐方面有着令人兴奋的前景。

安全考虑

我们已经创建了一个网络 Browsing 插件,允许语言模型访问网络浏览器,其设计优先考虑安全和作为网络良好公民来运作。该插件的基于文本的网络浏览器被限制在发出 GET 请求,这减少了(但没有消除)某些类别的安全风险。这使得 Browing 插件在检索信息方面很有用,但不包括”事务性“操作,如表单提交,因为这些操作涉及更多的安全和保障问题。

Browsing 使用 Bing 搜索 API 从网上检索内容。因此,我们继承了微软在以下方面的大量工作:(1)信息来源的可靠性和真实性;(2)防止检索有问题内容的”安全模式“。该插件在一个独立的服务中运行,因此 ChatGPT 的 browsing 活动与我们基础设施的其他部分分开。

为了尊重内容创作者并遵守网络规范,我们的浏览器插件的用户代理标记是 ChatGPT-User,并被配置为尊重网站的 robot.txt 文件。这可能偶尔会导致”click failed“的消息,这表明该插件正在尊重网站的指示,以避免抓取它。该用户代理仅用于代表 ChatGPT 用户采取直接行动,不用于以任何自动方式抓取网络。我们也已经公布了我们的 IP 出口范围。此外,我们还采取了限制速率的措施,以避免向网站发送过多的流量。

68d9ed436a2b4074a0ba3a5d8aa74378.png

你可以使用 robots.txt 文件阻止 ChatGPT 爬取你的网站,这时 ChatGPT 会显示这个错误消息。

我们的 Browsing 插件会显示访问过的网站,并在 ChatGPT 的回复中引用其来源。这种增加的透明度有助于用户验证模型反应的准确性,同时也将功劳归于内容创造者。我们认为这是一种与网络交互的新方法,并欢迎对其他方法的反馈,以推动流量回到源头,并增加生态系统的整体健康。

04

代码解释器(Alpha 阶段)

一个实验性的 ChatGPT 模型,可以使用 Python,处理上传和下载。

我们为我们的模型提供了一个在沙箱、防火墙执行环境中运作的 Python 解释器,以及一些临时的磁盘空间。由我们的解释器插件运行的代码在一个持久的会话中被评估,该会话在聊天对话期间是有效的(设有上限时间),随后的调用可以建立在彼此之上。我们支持将文件上传到当前的对话工作区并下载你的工作结果。

70e27dc772a98760251003f8913632a8.png

我们希望我们的模型能够使用它们的编程技能,为我们的计算机的最基本功能提供一个更自然的接口。让一个非常热心的初级程序员以指尖的速度工作,可以使全新的工作流程变得轻松和高效,并向新受众开放编程的好处。

从我们最初的用户研究中,我们已经确定了使用代码解释器特别有用的用例:

  • 解决数学问题,包括定量和定性的数学问题

  • 进行数据分析和可视化

  • 在不同格式之间转换文件

我们邀请用户尝试代码解释器集成并发现了其他有用的任务。

f04ed46aec9b1e7586df940846188c1f.png

安全考虑

将我们的模型连接到编程语言解释器的主要考虑因素是适当的沙盒执行,以便人工智能生成的代码不会在现实世界中产生意想不到的副作用。我们在一个安全的环境中执行代码,并使用严格的网络控制来防止外部互联网对已执行代码的访问。此外,我们还对每个会话设置了资源限制。禁用互联网访问限制了我们的代码沙盒的功能,但我们相信这是正确的初始权衡。第三方插件被设计为一种安全第一的方法,将我们的模型与外部世界连接起来。

05

检索

开源的检索插件使 ChatGPT 能够访问个人或组织的信息源(经许可)。它允许用户通过提问或用自然语言表达需求,从他们的数据源中获得最相关的文件片段,如文件、笔记、电子邮件或公共文档。

作为一个开源和自我托管的解决方案,开发者可以部署自己的插件版本,并在 ChatGPT 注册。该插件利用 OpenAI 嵌入,并允许开发者选择一个矢量数据库(Milvus、Pinecone、Qdrant、Redis、Weaviate 或 Zilliz)来索引和搜索文档。信息源可以使用 webhooks 与数据库同步。

开始着手可先访问检索插件库。

4774396686c98c25cddfba56051b4d9d.png

安全考虑

检索插件允许 ChatGPT 搜索一个矢量数据库的内容,并将最佳结果添加到 ChatGPT 会话中。这意味着它没有任何外部影响,主要风险是数据授权和隐私。开发者应该只在他们的检索插件中添加被授权使用并可以在用户的 ChatGPT 会话中分享的内容。

06

第三方插件(Alpha 阶段)

一个实验性的模型,知道何时以及如何使用插件。

8f0379a5b9988e2c995466f79b4b4143.png

ChatGPT 中的第三方插件

第三方插件由一个清单文件描述,其中包括机器可读的插件功能和如何调用它们的描述,以及面向用户的文档。

669979c9695ef952f697ff863e72461b.png

一个用于管理待办事项的插件的清单文件示例

创建插件的步骤是:

1、建立一个带有你希望语言模型调用的端点的 API(这可以是一个新的 API,一个现有的 API,或者一个专门为 LLM 设计的现有 API 包)。

2、创建一个记录你的 API 的 OpenAPI 规范,以及一个链接到 OpenAPI 规范并包括一些插件特定元数据的清单文件。

在 chat.openai.com 上开始对话时,用户可以选择他们希望启用的第三方插件。关于启用的插件的文档会作为对话上下文的一部分显示给语言模型,使模型能够根据需要调用适当的插件 API 来实现用户的意图。目前,插件是为调用后端 API 而设计的,但我们也在探索可以调用客户端 API 的插件。

5b29c617af20ccc44ecdb9b83b05593d.png

736a39f8bc64f061d3aac88820a7bb58.png

07

展望未来

我们正在努力开发插件,并把它们带给更多的受众。我们有很多东西需要学习,在大家的帮助下,我们希望建立一个既有用又安全的东西。

注:文中涉及多处视频演示,可参看原文。

巴比特园区开放合作啦!

001a6facc4354d19eb528b5636ff02b5.png

a30ded970a52cfa8b91a3d03344f9f85.jpeg

193a9976cd2693421c23c9bab7af60fe.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

8ac1fcb88a2db4594ccae6df5fa5e34c.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23367.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

OpenAI 再丢“王炸”:ChatGPT “封印”解除,能联网、搜索了!

整理 | 屠敏 郑丽媛 出品 | CSDN(ID:CSDNnews) 「乱花渐欲迷人眼」,新的一天里,OpenAI 再次丢出“王炸”:ChatGPT 推出插件功能,既能联网,也能开启搜索,还能执行代码和运…

三菱加工中心CNC编程G代码讲解

注意:在G之后没有接续数值指令中,在运转时将变成G00的动作。(注1)印有“*”记号表示初期状态应选择的指令码或被选择的指令码。印有“※”记号表示初期状态依参数所选定指令码或被选择的指令码。(注2)同一单…

如何用ChatGPT做咨询师,附Prompt

对基本问题研究得不深不透、得不到可靠的分析框架支持的情况下,仓促采取就事论事的应对措施 ,由于未能触及事情的根本,往往非但不能获得预期的效果,相反可能引发新的矛盾。 ——吴敬琏(著名经济学家,国务院…

chatGPT:5分钟制作PPT

近日,公司推广办公自动化,让我当回培训师,培训后勤部门员工如何使用RPA。做个培训PPT的重任自然得交给chatGPT了,以下是制作步骤: 步骤一:拟写提示词交chatGPT “你现在是一位编写PPT的高手。我会提出PPT的…

ChatGPT技巧大揭秘之PPT制作

接下来,我们将进入全新的ChatGPT篇章,这个篇章的主要目的是教大家如何正确地使用ChatGPT。很多人接触过ChatGPT,但是最终的结果都是不太满意,认为ChatGPT并没有传说中那么神奇。确实,要想让ChatGPT达到电影中那样神奇的…

安全的可靠的数据防泄密系统

大数据时代的来临,给人们的生活带来了很多便利,给企业提供了更多的商业机遇,而另一方面,大数据又增加了重要信息泄漏的风险,普通的信息安全防护手段在现阶段已经不能满足大数据时代的信息安全需求,需要专业…

恐怖的ChatGPT,肉哥也All in了!

这段时间真是太刺激了,AI领域几乎每天都会爆出一个超震撼的产品,有一种科幻马上要成现实的感觉。 不知道大家朋友圈是什么样,在整个创业的圈子里面,几乎全是 AI 相关。 就连 N 多年,传说中退休的传统互联网大佬&#x…

ChatGPT 速通手册——不同相似度算法的分值介绍

不同相似度算法的分值介绍 在信息大暴涨的今天,人类已经不可能出现通才、全才式的人物。利用 ChatGPT 来询问我们未知领域的知识是很好的习惯和用法。但对严肃知识的学习,一定要通过权威来源复核审校,保证自己所学知识的正确。否则&#xff…

亚马逊僵尸获取的三种方法 你正在使用哪一种?

亚马逊做跟卖的话是很简单便捷,不用自己大费周章的编写产品的listing 只需要找到一些合适的产品进行跟卖就可以了,还可以找到僵尸产品进行跟卖,我们常用的获取僵尸产品的三种方法; 第一种就是最原始的在亚马逊的商品页去找僵尸产品…

new bing 初体验:辅助看论文刚刚好

1. new bing使用条件 (1)安装Microsoft edge的dev版本 https://www.microsoft.com/zh-cn/edge/download?formMA13FJ (2)浏览器侧栏打开 Discover (3) 进入new bing 页面 侧栏展示 new bing 如果这一步,没有聊天功能…

在课堂上使用ChatGPT的三种创意方法

泰晤士世界大学排名. 自1910年从泰晤士报的一个高等教育专栏开始,经过100多年的建设和转变,泰晤士现已是一所世界大学大数据分析的国际机构,同时是获奖无数的国际高教传媒,每日及时报道各国各领域的高教发展趋势和走向。 在课堂上…

ChatGPT的横空出世,带给教育的冲击有多大?

最近很火的ChatGPT想必大家都有所耳闻,短短数日就占据了各大热搜榜单,或许我们无法明晰商业的浪潮,也对技术原理知之甚少,但它的功能却强大到让人叹为观止。 它可以写文章,可以做预算,可以编写代码……甚至…

腾讯工程师聊ChatGPT技术「文集」

想知道 ChatGPT 玩法、核心原理、搭建体验流程、最新竞品吗? 近期,美国人工智能研究机构 OpenAI 发布了最新的大语言模型 ChatGPT,其惊艳的性能在海内外掀起了一波又一波热潮。腾讯云开发者「热技解读」专栏特邀专家,从多方面分享…

2023 Chatgpt php源码

首次使用配置: 请访问 http://你的域名/key.php 配置您的API_KEY列表,程序将全局自动循环调用。默认用户名:admin,默认密码:admin2023。默认用户名密码可以在key.php文件中修改。 本项目完全开源,是PHP版…

GPT-3.5 也能直接联网了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! ChatGPT 常令人诟病的一个问题,就是它的模型训练数据,迄今为止用的还是 2021 年的老数据。 对于当下这个信息大爆炸时代,相隔两小时,消息都有…

ChatGPT进一步联网,距离成为超级流量入口还有多远?|数智焦点

备受瞩目的ChatGPT联网功能又更进一步。 继三月首次推出插件功能(Plugin)后,本周ChatGPT再次更新,将向Plus用户开放约70个第三方插件,覆盖购物、餐饮、旅行、天气、运算、翻译、分析数据等多种功能。 一个多月前&…

OpenAI 刚刚宣布了海量更新

OpenAI 刚刚宣布了海量更新,增加函数调用,支持更长上下文,价格更低! ​新模型上架 1、gpt-4-0613 2、gpt-4-32k-0613 3、gpt-3.5-turbo-0613 4、gpt-3.5-turbo-16k 部分模型降价 1、text-embedding-ada-002:$0.00…

申请GPT-4插件,等待GPT-4插件候补全过程

前言 GPT4相信大家都知道它的升级是带来更多惊喜的,目前GPT4已经推出了网页和插件功能,这些插件是专门为语言模型设计的工具。插件可以帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务。写文记录一下,如果你现正好有需要GPT-4 插件的需求,也可以参考一下。 过程 这…

Linux系统性能监控命令系列之 lsof

大家好!我是Sean! 继续咱们的Linux系统中的性能监控命令,今天要分享的是lsof。 lsof (list open files) (一个列出当前系统打开文件的工具) 在linux环境下,万物皆文件,通过文件不仅仅可以访问常规数据,还…

Docker

1.概念 容器和虚拟机比较: 容器是在操作系统层面上实现虚拟化,直接复用本地主机的操作系统,而传统方式则是在硬件层面实现。 与传统的虚拟机相比,Docker优势体现为启动速度快、占用体积小。 2.安装及配置 2.1安装在centos7中 …