HuggingGPT 火了:一个 ChatGPT 控制所有 AI 模型,自动帮人完成 AI 任务,网友:留口饭吃吧..._QbitAl 的博客 - CSDN 博客

转载自:https://blog.csdn.net/QbitAI/article/details/129942855

丰色 发自 凹非寺

量子位 | 公众号 QbitAI

最强组合:HuggingFace+ChatGPT ——

HuggingGPT,它来了!

只要给定一个 AI 任务,例如 “下面这张图片里有什么动物,每种有几只”。

它就能帮你自动分析需要哪些 AI 模型,然后直接去调用 HuggingFace 上的相应模型,来帮你执行并完成。

整个过程,你要做的就只是用自然语言将你的需求输出

这项由浙大与微软亚研院的合作成果,一经发布就迅速爆火。

英伟达 AI 研究科学家 Jim Fan 直呼:

这是我本周读到的最有意思的论文。它的思想非常接近 “Everything App”(万物皆 App,被 AI 直接读取信息)。

而一位网友则 “直拍大腿”:

这不就是 ChatGPT“调包侠” 吗?

AI 进化速度一日千里,给我们留口饭吃吧……

所以,具体怎么回事儿?

HuggingGPT:你的 AI 模型 “调包侠”

其实,若说这个组合物只是 “调包侠”,那格局小了。

它的真正用义,是 AGI。

如作者所言,迈向 AGI 的关键一步是能够解决具有不同领域和模式的复杂 AI 任务。

我们目前的成果离此还有距离——大量模型只能出色地完成某一特定任务。

然而大语言模型 LLM 在语言理解、生成、交互和推理方面的表现,让作者想到:

可以将它们作为中间控制器,来管理现有的所有 AI 模型,通过 “调动和组合每个人的力量”,来解决复杂的 AI 任务。

在这个系统中,语言是通用的接口

于是,HuggingGPT 就诞生了。

它的工程流程分为四步:

**首先,任务规划。**ChatGPT 将用户的需求解析为任务列表,并确定任务之间的执行顺序和资源依赖关系。

**其次,模型选择。**ChatGPT 根据 HuggingFace 上托管的各专家模型的描述,为任务分配合适的模型。

**接着,任务执行。**混合端点(包括本地推理和 HuggingFace 推理)上被选定的专家模型根据任务顺序和依赖关系执行分配的任务,并将执行信息和结果给到 ChatGPT。

**最后,输出结果。**由 ChatGPT 总结各模型的执行过程日志和推理结果,给出最终的输出。

如下图所示。

假定我们给出这样一个请求:

请生成一个女孩正在看书的图片,她的姿势与 example.jpg 中的男孩相同。然后请用你的声音描述新图片。

可以看到 HuggingGPT 是如何将它拆解为 6 个子任务,并分别选定模型执行得到最终结果的。

具体效果怎么样?

作者采用 gpt-3.5-turbo 和 text-davinci-003 这俩可以通过 OpenAI API 公开访问的变体,进行了实测。

如下图所示:

在任务之间存在资源依赖关系的情况下,HuggingGPT 可以根据用户的抽象请求正确解析出具体任务,完成图片转换。

在音频和视频任务中,它也展现了组织模型之间合作的能力,通过分别并行和串行执行两个模型的方式,完了一段 “宇航员在太空行走” 的视频和配音作品。

此外,它还可以集成多个用户的输入资源执行简单的推理,比如在以下三张图片中,数出其中有多少匹斑马。

一句话总结:HuggingGPT 可以在各种形式的复杂任务上表现出良好的性能。

项目已开源,名叫「贾维斯」

目前,HuggingGPT 的论文已经发布,项目则正在建设中,代码只开源了一部分,已揽获 1.4k 标星。

我们注意到,它的项目名称很有意思,不叫本名 HuggingGPT,而是钢铁侠里的 AI 管家贾维斯(JARVIS)

有人发现它和 3 月份刚发布的 Visual ChatGPT 的思想非常像:后者 HuggingGPT,主要是可调用的模型范围扩展到了更多,包括数量和类型。

不错,其实它们都有一个共同作者:微软亚研院。

具体而言,Visual ChatGPT 的一作是 MSRA 高级研究员吴晨飞,通讯作者为 MSRA 首席研究员段楠。

HuggingGPT 则包括两位共同一作:

Shen Yongliang,TA 来自浙江大学,在 MSRA 实习期间完成此项工作;

Song Kaitao,MSRA 研究员。

其通讯作者为浙大计算机系教授庄越挺。

最后,对于这个强大新工具的诞生,网友们很是兴奋,有人表示:

ChatGPT 已成为人类创建的所有 AI 的总指挥官了。

也有人据此认为:

AGI 可能不是一个 LLM,而是由一个 “中间人”LLM 连接的多个相互关联的模型。

那么,我们是否已经开启 “半 AGI” 的时代了?

论文地址:
https://arxiv.org/abs/2303.17580
项目链接:
https://github.com/microsoft/JARVIS

参考链接:
https://twitter.com/DrJimFan/status/1642563455298473986

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37992.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

“寻找贾维斯”简史

可能人人都希望自己有个“贾维斯”。 虽然已经退出漫威电影很多年,但是我们还是能够记起那个钢铁侠战衣里无所不能的AI助手。独特的幽默、优雅的语调,以及非常靠谱的人设,让无数科幻迷对这个看不见听得到的角色产生了无尽好感。 对贾维斯的…

jarvis贾维斯语音_保罗·贾维斯(Paul Jarvis)可以教给我们的建立业务的知识

jarvis贾维斯语音 想要在八到九个月内赚足够的钱,让您在一年中的剩余时间里做任何想做的事吗? (Want to make enough money in eight or nine months to last you for the rest of the year doing whatever the heck you want?) So do we. That’s why …

JARVIS(贾维斯)来了,科技改变生活

微软开源地址 https://github.com/microsoft/JARVIS 后续可能性: 每个人都有一个自己的AI助理提高生活便捷性学习知识的速度更快云助理 && 家用私人部署助理

谷歌拼音 输入法设置

谷歌拼音输入法 2.7,默认的是半角字符,中文标点 为了防止 以后 在输入代码的时候,出错,中文和 英文 都用 英文标点吧。

基于ubuntu20.4安装谷歌拼音中文输入法

1.首先命令行安装汉语语言包 sudo apt-get install language-pack-zh-hans 执行该命令后,系统就会自动安装所需要的汉语语言包 图1 安装汉语语言包 2.然后命令行安装谷歌拼音输入法 sudo apt-get install fcitx-googlepinyin 执行该命令后,系统就会自…

google输入法PK搜狗输入法

往往一个人用某个软件用的时间久了,久而久之就会形成一种习惯,不再探索或关注其他的类似的软件。造成的后果就是你只知道一款软件就这些功能,其余的知之甚少,就如同今天,看到别人输入法的皮肤特别漂亮,于是就想搜狗有这么漂亮的皮肤。问过后才知道人家用的是个google的拼…

Ubuntu20.04 安装谷歌拼音(googlepinyin)输入法

1.更新一下 sudo apt update 2.安装Fcitx sudo apt install fcitx如果有报错,执行下面命令 sudo apt install fcitx --fix-missing 3.命令行输入: im-config 弹出页面 ,选择ok,然后选择yes按钮,最后选择fcitx。…

谷歌拼音输入法PinyinIME源码修改----随着Setting中中英文的切换对应改变软键盘中英文输入且字符变换

项目中使用的是Google的输入法:谷歌拼音输入法,即PinyinIME。 客户提出需求:需要在Setting中切换中英文的时候,输入法对应成中英文输入,并且字符也对应成中英文,即Setting中设置为中文的时候,输…

安装google输入法后,左shift键不能切换中英文

解决方法 打开fcitx配置页 如图应有两个选项,即google拼音和 键盘英语,如不足,则选择左下角添加。 此后虽然可切换中英文,但是打开一个新页面后只按shift键却不能正常切换中英,必须要ctrl加空格后才能切换&#xff0c…

写在发现谷歌拼音输入法网站消失的今天

今天偶然发现谷歌拼音输入法PC版的网页消失了,我想以后可能都不会有了,除非谷歌重返大陆。 PC端的谷歌拼音输入法从2013年就已经停止更新,但这并不妨碍我继续使用它,之前它的官网一直都在,也提供下载。 之所以喜欢这…

Google推出拼音输入法了!

网址: http://tools.google.com/pinyin 下载地址:http://dl.google.com/pinyin/GooglePinyinInstaller.exe 用了一下,感觉挺好用的,同志们有兴趣的话,也试试看吧。恩 聪明的谷歌拼音输入法五大特色: …

网页上使用的输入法——Google Transliteration

简介 输入法通常是装在PC上用的,但是API有关部门的童鞋发现了专门在网页上用的输入法(见上图)。 这个插件的作用,按照官方说法: 您可以使用 Google 输入工具在网络中的任何位置以所选语言轻松地输入内容。 此接口采集自…

Python实战之12306抢票

实战:12306抢票 注意:代码运行之后,需要手动使用12306APP扫码登录 代码如下: import csv from selenium import webdriver from selenium.webdriver.chrome.service import Service from selenium.webdriver.support.ui import…

python实现12306全自动抢票

这个脚本目前只能刷一趟车的,人数可以是多个,支持选取作为类型等。 实现思路是splinter.browser模拟浏览器登陆和操作,由于12306的验证码不好自动识别,所以,验证码需要用户进行手动识别,并进行登陆操作&am…

小年到了,回家抢票太难,用Python做个脚本12306自动查票以及自动购票....

今天就是小年了,听说还有人买不到票?不要慌,今天咱们来用Python做一个自动查票抢票的脚本,24小时抢票,谁抢的过你!源码包已打包文件夹获取方式:点击这里【 Python全套资料】 即可获取。 准备工作…

C++写的12306抢票软件

写在前面的话 每年逢年过节,一票难求读者肯定不陌生。这篇文章,我们带领读者从零实现一款12306刷票软件,其核心原理还是通过发送http请求模拟登录12306网站的购票的过程,最后买到票。 郑重申明一下:这里介绍的技术仅供…

Python抢票神器

又到了一年一度的抢票大战,本来就辛苦劳累了一年,想着可以早点订到票跟家里人团聚。所以,许多人宁愿多花些钱去找黄牛买票。 但今年各种抢票软件的横行,还有官方出的加速包,导致连黄牛都不敢保证能买到票。你无奈的只能…

chatgpt赋能python:如何利用Python抢票

如何利用Python抢票 Python是一种非常流行的编程语言,可以轻松编写自动化工具。如果你想要在抢票热潮中获得胜利,这篇文章将向你展示如何使用Python编写程序来自动抢票。 抢票原理 在开始编写程序之前,我们需要了解如何抢票。抢票的原理是…

python写一个简单的12306抢票

引言 每逢过年就到了12306抢票高峰期,自己总想研究一下12306购票的流程,虽然网上已经很多资料,但是总比不过自己的亲身体会,于是便琢磨着写一个抢票软件,本人比较熟悉python,所以软件是用python写的。 使…

Python3.6实现12306火车票自动抢票(内含源码)

最近在学Python,刚好过完年啦!大家应该都需要买高铁票继续去当打工人了吧!所以用Python写了这个12306抢票脚本,分享出来,与大家共同交流和学习,有不对的地方,请大家多多指正。话不多说&#xff…