HuggingGPT火了:一个ChatGPT控制所有AI模型,自动帮人完成AI任务,网友:留口饭吃吧...

丰色 发自 凹非寺
量子位 | 公众号 QbitAI

最强组合:HuggingFace+ChatGPT ——

HuggingGPT,它来了!

只要给定一个AI任务,例如“下面这张图片里有什么动物,每种有几只”。

它就能帮你自动分析需要哪些AI模型,然后直接去调用HuggingFace上的相应模型,来帮你执行并完成。

58bbeaabd6bc545b2ddebf257907fd77.png

整个过程,你要做的就只是用自然语言将你的需求输出

这项由浙大与微软亚研院的合作成果,一经发布就迅速爆火。

9ad39612374b71f60fcede8222f9edf3.png

英伟达AI研究科学家Jim Fan直呼:

这是我本周读到的最有意思的论文。它的思想非常接近“Everything App”(万物皆App,被AI直接读取信息)。

而一位网友则“直拍大腿”:

这不就是ChatGPT“调包侠”吗?

81b3df9ae4378f5addbb6d6aacabd417.png

AI进化速度一日千里,给我们留口饭吃吧……

dfef697fb3f7b642d88e9e843075808d.png

所以,具体怎么回事儿?

HuggingGPT:你的AI模型“调包侠”

其实,若说这个组合物只是“调包侠”,那格局小了。

它的真正用义,是AGI。

如作者所言,迈向AGI的关键一步是能够解决具有不同领域和模式的复杂AI任务。

我们目前的成果离此还有距离——大量模型只能出色地完成某一特定任务。

然而大语言模型LLM在语言理解、生成、交互和推理方面的表现,让作者想到:

可以将它们作为中间控制器,来管理现有的所有AI模型,通过“调动和组合每个人的力量”,来解决复杂的AI任务。

在这个系统中,语言是通用的接口

于是,HuggingGPT就诞生了。

它的工程流程分为四步:

首先,任务规划。ChatGPT将用户的需求解析为任务列表,并确定任务之间的执行顺序和资源依赖关系。

其次,模型选择。ChatGPT根据HuggingFace上托管的各专家模型的描述,为任务分配合适的模型。

接着,任务执行。混合端点(包括本地推理和HuggingFace推理)上被选定的专家模型根据任务顺序和依赖关系执行分配的任务,并将执行信息和结果给到ChatGPT。

最后,输出结果。由ChatGPT总结各模型的执行过程日志和推理结果,给出最终的输出。

如下图所示。

假定我们给出这样一个请求:

请生成一个女孩正在看书的图片,她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务,并分别选定模型执行得到最终结果的。

99e1cc5e57cd04c947f33863c068eec8.png

具体效果怎么样?

作者采用gpt-3.5-turbo和text-davinci-003这俩可以通过OpenAI API公开访问的变体,进行了实测。

如下图所示:

在任务之间存在资源依赖关系的情况下,HuggingGPT可以根据用户的抽象请求正确解析出具体任务,完成图片转换。

e3a812097e90626dce5c1d3a805094da.png

在音频和视频任务中,它也展现了组织模型之间合作的能力,通过分别并行和串行执行两个模型的方式,完了一段“宇航员在太空行走”的视频和配音作品。

20b38d6b87689c55cc046d4bbce923d8.png

此外,它还可以集成多个用户的输入资源执行简单的推理,比如在以下三张图片中,数出其中有多少匹斑马。

124decb833d43580a8ea6a94d3ff36ed.png

一句话总结:HuggingGPT可以在各种形式的复杂任务上表现出良好的性能。

项目已开源,名叫「贾维斯」

目前,HuggingGPT的论文已经发布,项目则正在建设中,代码只开源了一部分,已揽获1.4k标星。

我们注意到,它的项目名称很有意思,不叫本名HuggingGPT,而是钢铁侠里的AI管家贾维斯(JARVIS)86f1a519ddbc86484ecc0d1919d4a98a.png

c64509d121f5acafb9dc4225ffd4b457.png

有人发现它和3月份刚发布的Visual ChatGPT的思想非常像:后者HuggingGPT,主要是可调用的模型范围扩展到了更多,包括数量和类型。

c2be7777c26ae807c9018557368e7d41.png

不错,其实它们都有一个共同作者:微软亚研院。

具体而言,Visual ChatGPT的一作是MSRA高级研究员吴晨飞,通讯作者为MSRA首席研究员段楠。

HuggingGPT则包括两位共同一作:

Shen Yongliang,TA来自浙江大学,在MSRA实习期间完成此项工作;

Song Kaitao,MSRA研究员。

其通讯作者为浙大计算机系教授庄越挺。

76d89ed772bde4e24afbc0fd2aef9531.png

最后,对于这个强大新工具的诞生,网友们很是兴奋,有人表示:

ChatGPT已成为人类创建的所有AI的总指挥官了。

6ffe05212cc3e000d135e1ba1de915eb.png

也有人据此认为:

AGI可能不是一个LLM,而是由一个“中间人”LLM连接的多个相互关联的模型。

19c93e4d8c7457a9560898f94bce4a96.png

那么,我们是否已经开启“半AGI”的时代了?

6640a0a647171b20097cfc7eabf17dcc.png

论文地址:
https://arxiv.org/abs/2303.17580
项目链接:
https://github.com/microsoft/JARVIS

参考链接:
https://twitter.com/DrJimFan/status/1642563455298473986

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/628.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[ChatGPT]警惕科技巨头的ChatGPT崇拜

2023年ChatGPT的横空出世,让AI成为无可辩驳的强大风口,各大科技公司更是纷纷赶着上线对应产品。对于ChatGPT的崇拜,是投资者的盲目跟风,还是大厂在制造焦虑呢?一个聊天机器人,又是如何拿捏资本和厂商的?一起来看一下吧。 2023年,ChatGPT的横空出世,让AI成为无可辩驳的…

ChatGPT前传

文章目录 前言GPT概述GPT-1代GPT-1 学习目标和概念介绍GPT-1 训练数据集GPT-1 模型结构和应用细节GPT-1 效果性能和总结 GPT-2代GPT-2 学习目标和概念介绍GPT-2 训练数据集GPT-2 模型结构和应用细节GPT-2 性能效果和总结 GPT-3代GPT-3 学习目标和概念介绍GPT-3 训练数据集GPT-3…

上海亚商投顾:创业板指低开高走ChatGPT概念股再爆发

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 大小指数今日走势分化,沪指盘中一度跌超1%,午后震荡回升跌幅收窄,创业板指则低…

十条ChatGPT常用的Prompt

Prompt 本文数据来源:@Will 3.6-6.16 硅谷,原作者:@rowancheung 一,简化复杂的信息 Prompt: 将(主题)分解成更小、更容易理解的部分。使用类比和现实生活中的例子来简化概念并使其更相关 Break down the (topic) into smaller, easier-to-understand parts. Use ana…

自己动手做chatGPT:向量的概念和相关操作

chatGPT的横空出世给人工智能注入一针强心剂,它是历史上以最短时间达到一亿用户的应用。chatGPT的能力相当惊人,它可以用相当流利的语言和人对话,同时能够对用户提出的问题给出相当顺畅的答案。它的出现已经给各个行业带来不小冲击&#xff0…

上海亚商投顾:沪指窄幅震荡 ChatGPT概念股全线下挫

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 三大指数早盘小幅冲高,随后又震荡走低,午后一度集体翻绿,临近尾盘有所回升。Ch…

详细解读ChatGPT

文章目录 前言一、ChatGPT的本质二、语言模型的发展阶段三、语言模型的能力边界四、ChatGPT如何回答问题?五、ChatGPT的缺陷六、ChatGPT需要的资源七、人工智能的边界在哪里? 前言 ChatGPT是什么?我调用了api_key对它提问,大家可以…

上海亚商投顾:创业板指高开高走 ChatGPT概念卷土重来

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 沪指今日红盘震荡,深成指、创业板指小幅走高,科创50指数涨近1.5%。ChatGPT概念股再度爆发&…

上海亚商投顾:沪指窄幅震荡 ChatGPT概念再度走高

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 沪指今日窄幅震荡,创业板指低开低走,午后跌幅扩大至1%,宁德时代一度跌近4%。6G…

谷歌推Bard引发灾难性发布:市值蒸发千亿美元 带崩ChatGPT概念

雷递网 乐天 2月9日 所谓心急吃不了热豆腐,用在谷歌身上最合适不过。 为了应对ChatGPT爆红带来的挑战,谷歌迅速推出类ChatGPT产品Bard,却发生了灾难性发布,引发了外界对AI聊天机器人Bard的嘘声。 近期,谷歌推出了一则视…

《扬帆优配》ChatGPT概念股遭集体抛售!

ChatGPT忽然走红全球带火了一批A股上市公司。 本周,ChatGPT指数经过多个买卖日的横盘整理后再度走强,并多次创下前史新高。与此同时,汤姆猫、科大讯飞、创业黑马、格灵深瞳等一大批ChatGPT概念股,在股价大涨后抛出减持方案。 Cha…

GPT-4超强进化,近万人联名封杀!ChatGPT概念股暴跌

【导读】最近,全世界都燃起一股围剿ChatGPT的势头,除了业内大佬,欧盟各国和白宫也纷纷出手。然而,恐怖的是,GPT-4已经悄悄拥有了自我进化的能力。 GPT-5的威胁,已经黑云压顶。 GPT-4诞生后,AI…

上海亚商投顾:沪指震荡调整ChatGPT概念股连续大涨

上海亚商投顾前言:无惧大盘涨跌,解密龙虎榜资金,跟踪一线游资和机构资金动向,识别短期热点和强势个股。 市场情绪 大小指数今日走势分化,沪指低开后震荡调整,深成指、创业板指小幅反弹。ChatGPT概念股连续大…

【GPT】P1 ChatGPT 概念普及,学习路线与技术栈

GPT 知识储备 GPT 学习路线 这是一条不激进的学习路线,步步为营;对于没有基础的初学者比较适合,但是学习周期非常长,需要坚持; 而比较激进的学习路线即直接瞄准核心,直击 Transformer 语言架构&#xff0c…

ChatGPT概念股:聊天机器人市场的新方向

随着人工智能技术的不断发展,聊天机器人作为其中的一个重要领域正在逐步崛起。而基于生成式预训练的自然语言处理技术ChatGPT,则是聊天机器人核心技术之一,已经成为了聊天机器人市场中备受关注的投资方向之一。ChatGPT概念股代表了聊天机器人…

ChatGPT API实现多轮对话的实战代码

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

chatGPT 生成随机漫步代码

目录 1. chatGPT 写的随机漫步代码 2. 笔者写的随机漫步代码 3. 总结 1. chatGPT 写的随机漫步代码 最近在学习 Python 中的 随机漫步 知识点,突发奇想,心血来潮,想着用 chatGPT 来生成随机漫步代码,让我们来看看是啥效果…

ChatGPT 能自己跑代码了!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! time leap, sci-fi, photorealistic, --niji 5 --ar 3:2 --s 1000 自 ChatGPT 发布以来,各行各业对其能力探索的举措一直没有停止。 很多大厂纷纷跟进,竞相推出自研…

【ChatGPT实战】11.如何使用ChatGPT写代码?

以往大家总是调侃说程序员只要会用Google就好了,直接搜对应的代码然后复制粘贴就可以了。但是只有程序员才知道真要找到可用的代码是不容易的,经常是找很久都没有合适的代码。 ChatGPT在编程方面拥有着不可忽视的优势,能够生成高质量的程序代…

代码看不懂?ChatGPT 帮你解释,详细到爆!

偷个懒,用ChatGPT 帮我写段生物信息代码 如果 ChatGPT 给出的的代码不太完善,如何请他一步步改好? 网上看到一段代码,不知道是什么含义?输入 ChatGPT 帮我们解释下。 生信宝典 1: 下面是一段 Linux 代码,请…