ChatGPT 一统所有 AI 模型入口,四步实现文本分类、图像生成等 24 种复杂任务!...

dcf69f445981de66db885a50fa6aaf41.gif

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

ChatGPT、GPT-3、GPT-4、text-davinci-003......近两年来,大模型层层出不穷,使人眼花缭乱,在不同的场景下,很多研究人员往往不知该作何选择?

为了解决这一难题,微软亚洲研究院和浙江大学的研究团队展开合作,发布了一个大模型协作系统——HuggingGPT,让 ChatGPT 与人工智能社区 HuggingFace 连接起来,将语言作为通用接口,让 LLM 作为控制器,管理行业内现有的所有人工智能模型。

「解决不同领域和模式的复杂人工智能任务是迈向 AGI 的关键一步」,研究团队在最新发布的 HuggingGPT 论文(https://arxiv.org/pdf/2303.17580.pdf)伊始说道。

3ea5484aced2d405555e87ac0648f102.png

HuggingGPT 的初衷

在研究团队看来,目前的 LLM 技术可以在语言理解、生成、互动和推理方面具有不错的能力,但是在建立先进的 AI 系统道路上仍然有一些紧迫的挑战:

  • 限于文本生成的输入和输出形式,尽管 LLM 在 NLP 任务中表现显著,但是仍缺乏处理视觉和语音等复杂信息的能力;

  • 在现实世界的场景中,一些复杂的任务通常由多个子任务组成,因此需要多个模型的调度和合作,这也超出了语言模型的能力范围;

  • 对于一些具有挑战性的任务,LLM 在一些情况下表现出优秀的结果,但它们仍然比一些专家(例如,微调模型)弱。

如何解决这些问题可能是 LLM 走向更先进的人工智能系统的第一步,也是关键的一步。

HuggingGPT 的出现旨在能够让 LLM 与外部的模型协调,合力解决上述挑战。

52e42cf472299a26e6b72a53da112001.png

8802675f8f6836e5f7e78102752d20d9.png

HuggingGPT 的原理

具体来看,我们使用 ChatGPT 在收到用户请求时进行任务规划,根据机器学习社区 Hugging Face 中的功能描述选择模型,用选定的人工智能模型执行每个子任务,并根据执行结果总结响应。

通过利用 ChatGPT 强大的语言能力和 Hugging Face 中丰富的人工智能模型,HuggingGPT 能够覆盖不同模式和领域的众多复杂的人工智能任务,并在语言、视觉、语音和其他挑战性任务中取得令人印象深刻的结果,为实现高级人工智能铺设了一条新的道路。

根据论文解释,HuggingGPT 的整个过程可以分为四个阶段:

  • 任务规划:使用 ChatGPT 分析用户的请求,了解他们的意图,并将其拆解成可解决任务。

  • 模型选择:为解决计划任务,ChatGPT 根据描述选择托管在 Hugging Face 上的模型。

  • 任务执行:调用并执行每个选定的模型,并将结果返回给 ChatGPT。

  • 响应生成:最后使用 ChatGPT 整合所有模型的预测,进行总结和输出。

487a75650acab6adcf0288c26b745df7.png

在这样的设计下,HuggingGPT 能够使用外部模型,也可以整合多模态感知能力,处理多个复杂的人工智能任务。

论文透露,HuggingGPT 目前通过利用 LLM(如 ChatGPT)来连接机器学习社区(如 Hugging Face)中各种人工智能模型,覆盖文本分类、目标检测、语义分割、图像生成、问答、文本到语音、文本到视频等 24 个任务。

5392166f2b030fb869bfc89f0c0aba73.png

样样都行的 HuggingGPT

在论文中,研究团队以实例进行了解释。如下图:分析 example1.jpg 中姿态和example2.jpg 的描述,重新生成一张图片。

通过 HuggingGPT 流程的第一步任务规划,即让 ChatGPT 分析用户的请求,ChatGPT 得出生成新图片过程涉及三步,进而自动进行模型选择:使用一个「openpose-control」模型来提取篮球图像中的姿势信息;进而使用「nlpconnect/vit-gpt2-image-captioning」生成图像中关于男孩的描述;第三步,执行任务之后,使用 Illyasviel/sd-controlnet-openpose 模型结合姿态信息和描述生成最终的图像。

c7def16022bf065f1d4f58f230cc1dfc.png

HuggingGPT 也可以对音频和视频模式的多模型合作进行定性分析:

5d326d3da28916f8815e654261567cea.png

除此之外,HuggingGPT 可以整合多个用户输入资源来进行简单的推理,得到正确的答案。

18ec18fe992e0d9643decc8a9ce315ba.png

9dd32c41841e554553603fda6230802b.png

写在最后

HuggingGPT 论文的发布引发了不少 AI 专家的关注,如果其正式落地,那么只需要通过 ChatGPT 一个入口就可以访问到各种适用的模型。

对此,英伟达 AI 科学家、斯坦福博士 Jim Fan 评价道:

HuggingGPT 是我本周阅读的最有趣的论文。它非常接近我描述的“Everything App”愿景。ChatGPT 充当 “AI 模型空间”的控制器,根据人类规范选择正确的模型(应用程序),并正确组装它们以解决任务。它是一种“低带宽”方式的多模态——所有模态都需要通过文本字符串进行压缩和连接。HuggingGPT 也与 Prismer 的想法有关:尽可能利用预训练的领域专家模型。有时少训练就是多做事!

ec284aff50fe402e853f394dc171b3f8.png

为了更好地落地这个愿景,研究团队在 GitHub 上开源了它的基础代码(https://github.com/microsoft/JARVIS),且命名为“Jarvis”(贾维斯),供大家参考学习。

值得注意的是,很多网友直言,它的系统要求可能会直接劝退了不少人:

da59fef490ba2f5f5376800ddbe5a2fd.png

但是 HuggingGPT 也可以作为通往 AGI 的准入口。

相关链接:

https://github.com/microsoft/JARVIS

https://arxiv.org/pdf/2303.17580.pdf

2b4f8c46e46979c9834fcb54d37a979e.gif

 
 
☞最爱 ChatGPT,每天编码 300 行,月薪 8k-17k 占比骤减!揭晓中国开发者真实现状
☞裁掉6000人后,马斯克:管理Twitter的心情就像过山车,现金流转正!
☞微软开源 Deep Speed Chat

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/137.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从 ChatGPT 被挤崩,浅谈如何做入口限流?

作者: 张斌斌:Nacos&Sentinel Committer 最近 ChatGPT 很火,激起了社会广泛关注和学习热潮,记得上次我通宵学习 AI 知识还是 Goolgle 发布最新算法的时候。当时我考虑是不是要转行去搞 AI,不然就有被淘汰的风险&a…

阿里云通义千问官网上线了(阿里版ChatGPT)

阿里版ChatGPT的通义千问上线了,官网:https://tongyi.aliyun.com/ 阿里云的二级域名,你拿到邀请码了吗? 阿里云通义千问邀请码 阿里云通义千问大模型能力测试体验,人工智能语言大模型,还没拿到邀请码的同学…

阿里版 ChatGPT 已进入测试

点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源…

使用openai模块接入chatGPT,无需魔法可直接畅聊

本人早先买了一个外网服务器,闲置没用,最近ChatGPT爆火,突发奇想,是否可以利用外网服务器,搭建服务端网页端来实现国内访问。 说干就干,首先需要准备以下工具: chatgpt API 密钥外网服务器&am…

bing必应引入chatgpt为什么我没看到在哪里?

一、在哪里可以看到 1、主页 打开https://bing.com/ 也就是bing国外的主页,当然国内的主页cn.bing.com还没有chatgpt。可以看到搜索栏变成了一个拉长的对话框 2、搜索页面 大家可以看到在这个栏目会多出一个“聊天”的项目 二、bing的chatgpt是什么效果 三、为什么我…

ChatGPT实用使用指南 让它解你所问

Chatgpt无疑是这几年来影响力最大的AI技术之一,生成式的AI模型正在促进各个行业的效率和自动化发展,Chatgpt对于个人、企业和各个行业都有着一定的影响 在我刚接触的时候,发现对Chatgpt的认知太肤浅了,一个最强的ai聊天机器人摆在…

chatGPT研究-(一)使用入门及Access Denied打不开问题解决

从去年底chatGPT刚出来到现在,除了官方openAI入口外,很多二次包装后的渠道、小程序产品层出不穷,同时包括百度文心一言等自研AIGC产品也是相继推出,感觉大模型研究确实被带火了一把。目前据了解,openAI使用时有很多限制…

Chatgpt详细登录教程

一、准备“梯子” 梯子、科学上网、翻墙,三者是同一个意思。本店没相关科技产品和服务,请用户各显神通。 1. 确认IP 打开跳转入口,看下图 ​ 2.尝试登录 注意,第1点不是必需的,有些设备ip查询会延迟但当下依然能登…

ChatGPT:重新定义搜索入口

ChatGPT是实现模糊搜索到精准推送的跨时代巅峰之作。ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfile.com/f/2501739-805099579-92a952?p2096 (访问密码: 2096) 参考文献: [1]ChatGPT:重新定义搜索入口_up.pdf: https://url39.ctfil…

国内版 ChatGPT值不值得上手----PlumGPT测评

前言:什么是PlumGPT(国内版的chatgpt),PlumGPT国内版ChatGPT是一个基于GPT-3.5算法的人工智能聊天机器人,能够通过自然语言与用户交互,提供各种服务和解答各种问题。本文将对PlumGPT国内版ChatGPT进行全面测…

【ChatGPT】还不会用ChatGPT ?快来看看ChatGPT如何为你所用吧——

毫无疑问,ChatGPT 已经风靡全球,推出仅仅一周就拥有了 100 万用户。 OpenAI 推出了这个受欢迎的聊天机器人或语言模型,它可以根据给定的输入生成类似于人类的文本。人们已经用 ChatGPT 生成了几乎各种类型的文本,从论文、诗歌到落地页和网站。 这个聊天机器人还能生成代…

国内版的ChatGPT弯道超车的机会在哪里?

前言 从去年11月最后一天ChatGPT诞生,截至目前,ChatGPT的热度可谓是爆了。众所周知,ChatGPT是美国“开放人工智能研究中心”研发的聊天机器人程序,它是一个人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人…

ChatGPT到底怎么用?

ChatGPT简介 ChatGPT(Chat Generative Pre-trained Transformer)全称为生成型预训练变换模型,由美国 OpenAI团队研发。现如今的ChatGPT不仅可以根据聊天上下文进行交互,还可以进行文学创作、翻译、编写代码等,相信以后…

亲测:Chatgpt国内就能使用,全面支持中文

ChatGPT是什么? ChatGPT是一个基于人工智能技术的聊天机器人网站,它使用了GPT(Generative Pre-trained Transformer)模型来生成自然语言响应。用户可以在ChatGPT上与机器人进行对话,机器人会根据用户的输入生成相应的回…

chatGPT爆火,什么时候中国能有自己的“ChatGPT“

目录 引言 一、ChatGPT爆火 二、中国何时能有自己的"ChatGPT" 三、为什么openai可以做出chatGPT? 四、结论 引言 随着人工智能技术的不断发展,自然语言处理技术也逐渐成为了研究的热点之一。其中,ChatGPT作为一项领先的自然语言处理技术…

如何更好的利用chatgpd 国内

文章目录 前言好用的网站更好的使用AI 前言 当您需要一位聪明、快速、准确地回答问题并提供帮助的伙伴时,您可以考虑ChatGPT。ChatGPT是OpenAI开发的大型语言模型,它可以理解人类语言并以自然的方式回答问题。但由于某些因素,国内无法正常访…

在国内,如何优雅的使用ChatGPT??

ChatGPT 是一个在线的语言模型,可以通过 Web 端访问。 由于中国大陆地区的网络环境和政策原因,访问 Web 端可能会遇到一些困难。 以下是一些可能可行的方法: 1、使用 VPN 通过使用 VPN 可以切换到国外的网络环境,从而访问 Cha…

国内也能畅玩gptchat,游玩攻略分享

看到很多人都不知道怎么玩gptchat,小编就不能忍了,其实要玩chatgpt是非常的简单的,完全是能免费体验chatgpt的强大的。下面我们一起来了解一下国内也能畅玩gptchat,游玩攻略分享。 一.Chatgpt国内为啥能玩 其实现在很多的程序都接…

chatgpt是什么东西?chatgpt在国内能用吗

chatgpt是什么意思? ChatGPT 是一种“以对话方式进行交互”的聊天机器人模型,是一种由 AI 技术驱动的自然语言处理工具,可让您与聊天机器人进行类似人类的对话等等。语言模型可以回答问题并帮助您完成撰写电子邮件、论文和代码等任务。这种类型的生成式…

pycharm中使用chatgpt

前言 ChatGPT是目前最强大的AI,不仅能够聊天、写小说,甚至码代码也不在话下。 但是在国内要使用chatgpt很麻烦,国内一家团队开发了一款idea插件NexChatGPT,用数据代理的方式,让我们在国内也能轻松的使用chatgpt。 没…