【TaskMatrix.AI - Visual ChatGPT】连接超大模型和超多API来完成任务

Github项目地址:https://github.com/microsoft/TaskMatrix

目前大规模预训练模型(比如ChatGPT)已经能够完成多个任务,例如

  • 提供强大的对话功能,in-context learning能力和代码生成能力
  • 生成高层次的解决问题框架

然而,对于特定领域的特殊问题,由于大模型没有见过类似数据的原因导致在这些任务上表现的较差。

另外,对于特定领域的问题,目前也已经有现成的模型或系统做的比较好了,但这些解决特定问题的模型并不容易和大模型适配。

所以为了解决上面两个问题,需要一种结合的机制:

  • 大模型提供问题解决的整体方案
  • 方案中的子任务使用特定领域的小模型解决

TaskMatrix.AI

微软提出了TaskMatrix.AI,这是一个模型的生态系统,这个系统中大模型作为大脑(brain-like central system),其它小模型作为子任务的求解器(sub-task solvers)。

从深度学习发展的历史来看,目前貌似进入了一个新的时代
在这里插入图片描述
TaskMatrix.AI的整体框架如下:
在这里插入图片描述
从组成成分来看,TaskMatrix.AI包括Multimodal Conversational Foundation Model (MCFM),API Platform(特定领域的模型/求解器作为API供大模型调用)和API Selector。

从工作机制来看,MCFM首先获取多模态的输入,第一步生成解决方案的概要。API Selector拿到这个概要后决定从API Platform中调用哪些工具。第二步MCFM拿到API调用结果后生成动作序列,最后执行这些动作后得到最终输出。

从后续学习的角度来看,最终产生的输出可以用与RLHF反馈给模型以调整MCFM参数,也可以反馈给API Developer以提供更好的API服务。

Visual ChatGPT

Visual ChatGPT是上面TaskMatrix.AI 框架的一个应用案例,即给ChatGPT加入图像处理的功能。

基本的想法是:

  • 视觉基础模型(VFM)在计算机视觉中显示出巨大的潜力,已经可以处理很多图像任务
  • Visual ChatGPT直接基于ChatGPT并结合了各种VFM,以给ChatGPT加入视觉智能。

在这里插入图片描述
文中提出了一种Prompt Manager的模块管理ChatGPT的输入,这种输入中可以引入多个视觉基础模块的生成或处理结果,从而使得在ChatGPT中可以处理图片。

在这里插入图片描述
上图展示了一个案例,左边是对话过程,中间是处理流程,右边是处理细节。可以看出流程中的主要部分是要决定是否要使用VFM模块,如果使用则需要引入具体的视觉模型进行处理,并将进行迭代决定是否继续使用VFM。右边是对Q2的回答细节,其中前两步都是要使用VFM处理图片,最后讲处理后的图片输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27203.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

轻松写完周报,AI来帮你

我所认识的周报 一周又一周,有到了写周报的时间了,这周比较烦。改如何写好周报呢? 大部分人的烦恼。 🐳 写周报这件“烦恼”大事,用幽默的眼光来看,也不是没有点乐子。 🐌 信息爆炸,我脑袋都大了一圈。一周之内,邮…

chatgpt赋能python:Python生成窗口——打造与用户互动的界面

Python生成窗口——打造与用户互动的界面 Python是一种高级的解释型编程语音,因其易读易懂和丰富的库资源而备受推崇。在Python中,我们可以使用Tkinter来创建GUI(Graphical User Interface)的应用程序。通过使用Tkinter库&#x…

汽车行业大趋势——软件定义汽车

文章目录 前言一、软件定义汽车的驱动力二、SOA架构在软件定义汽车中的作用三、车载软件架构(内核、中间件、应用层)长期趋势总结 前言 最早在2007年4月份的IEEE会议中提出“软件定义汽车”(SDV,Software Define Vehicle&#xf…

智能汽车赛道,风向变了

“过去1个月时间,我们拜访了近20家汽车智能化核心软硬件供应商,如果给2023年的行业形势一个关键词,就是不确定性。”3月29日,2023年度(第五届)高工智能汽车市场峰会上,高工智能汽车研究院首发了…

汽车行业未来五年重塑人类与汽车关系的五种方式 | 美通社头条

美通社消息:财富500强全球技术服务公司DXC Technology预测了汽车行业未来五年内重塑人类与汽车关系的五种方式。 向软件定义车辆转型正在改变汽车行业的各个方面,从汽车的设计方式到制造方式,再到我们如何使用和维护汽车。至关重要的是&#…

AutoAI 2023峰会观察:数据驱动变革,迎接智驾未来

在驶向智驾未来的科技之路上,数据正在发挥什么样的重要作用? AutoAI 2023中国峰会盛大召开 近日,AutoAI 2023第六届无人驾驶及智能驾舱中国峰会在上海盛大召开,AutoSec 7周年年会暨中国汽车网络安全与数据安全合规峰会也于同期一起…

当软件定义汽车成为趋势,未来汽车是否可以理解为四个轮子上的超级计算机?

文章目录 浅谈汽车软件行业汽车软件的现状和发展方向本文首发于EE汽车荟,在微信公众号搜索“EE汽车荟”可以查看。简介:本文就目前比较热的“汽车软件”话题,做一些讨论。也试图回答大家比较关心的三个问题。内容主要有三方面:1&a…

布局未来移动出行,需要怎样的互联汽车解决方案?

面对移动出行市场的广袤前景,传统整车厂需要如何开展转型?未来的移动出行生态,又需要什么样的全场景互联汽车解决方案? 传统车企未来的转型方向 众所周知,传统整车厂的业务模式,往往都聚焦在汽车的制造和销…

ChatGPT们生成的摘要足够好,读者不来看新闻怎么办?

自从人工智能研究公司OpenAI在去年11月推出ChatGPT以来,AI聊天机器人吸引了商界的注意力。最近几周,微软推出了使用OpenAI技术的聊天机器人,谷歌也发布了名为Bard的系统。 据报道,美国新闻行业正将AI聊天机器人​视为一种新的生存…

Ethereum钱包区块同步问题

最近在研究以太坊的智能合约,从官网下载了Ethereum Wallet和Mist发现都不能同步区块。一直卡在 downloading new node这里。网上找了半天也没有找到问题所在,可能出现这个问题的人不多吧。 我这里写一下解决办法,免的有人和我一样。 之所在出…

今天终于找到了一款windows下的Zcash钱包(ZEC钱包),推荐给大家

折腾了好几天,想说下linux真心不适合我这类新人,所以导出百度,终于在官网看到一个链接 MacOS,想来这个应该是苹果系统的,有苹果,肯定也会有Windows的,于是点进去继续淘宝 后台请教朋友&#xff…

钱包:BUMO 小布口袋 APP 用户手册

BUMO 小布口袋 APP 用户手册 小布口袋APP 简介 小布口袋App是BUMO开发的一款数字钱包管理工具,用户可创建属于自己的身份及钱包, 对自己的资产进行管理,小布口袋官方下载链接为:https://bumo.io/wallet/appDetail。 转账 用户…

Omni/USDT钱包对接PHP开发包

OmniTool开发包适用于为PHP应用快速增加对Omni Layer/USDT数字资产的支持能力,即支持使用自有Omni Layer节点的应用场景,也支持基于第三方API服务和离线裸交易的轻量级部署场景。下载地址:omni/usdt php开发包 。 1、OmniTool开发包简介 Omni…

使用ethers.js创建以太坊HD钱包(生成BIP-039 + BIP-044钱包),在根据私钥、助记词找回钱包!

一、什么是ethers.js ethers.js库旨在成为一个完整而紧凑的库,用于与以太坊区块链及其生态系统进行交互。它最初设计用于ethers.io,后来扩展为更通用的库。官方链接:https://docs.ethers.io/ethers.js/html/getting-started.html 二、在Nod…

钱包:BOMO 轻钱包用户手册

BOMO 轻钱包用户手册 简介 Quick Wallet是网页版轻量级钱包,用户可快速登录Quick Wallet 进行发送BU的操作。目前,Quick Wallet有正式版和测试版,正式版网址为 https://quickwallet.bumo.io,测试版网址为 https://quickwallet.b…

usdt钱包地址查询_钱包开发 - USDT - 一、Omni本地钱包安装

1.win 官网下载安装 进入qt目录 命令行: 1.开始客户端 > omnicore-qt.exe -testnet -server -rpcbind=127.0.0.1 -rpcport=18332 -rpcuser=RPCuser -rpcpassword=RPCpasswd -datadir=“f:xxx” 如果安装了其他节点 需要指定data目录 > -datadir=“f:xxx” 指定钱包文件 …

区块链钱包

区块链钱包 一,关于钱包 关于钱包的加密货币中常见的误解是它们存储Token。 钱包不存储Token。 钱包的作用是将私钥存储在加密文件中并签署交易。 钱包只含有密钥,而包含钱币。 每个用户有一个包含多个密钥的钱包。 钱包只包含私钥/公钥对的密钥链。因…

LaTeX中的拼写及语法检查

在使用Overleaf或者texstudio进行LaTeX编辑的时候,一个不方便的地方就是不能像Word那样进行拼写及语法检查,也不能安装grammarly插件。 Overleaf和texstudio都有检查单词拼写的基础功能,但对于一些语法检查应该还不行。 目前没有找到特别满意…

oauth2授权码模式——微信第三方登录原理

oauth2有四种授权模式,授权码模式是最常用的模式 oauth2其实就是一种通用的协议,如果你的应用想要支持这种协议就需要通过代码来实现它 不过也没有谁会从头开始去实现这个协议,各种编程语言已经有现成的框架已经实现了oauth2协议&#xff0…

登陆时做下双因子验证

原文链接:http://www.ruanyifeng.com/blog/2017/11/2fa-tutorial.html 双因素认证(2FA)教程 所谓认证(authentication)就是确认用户的身份,是网站登录必不可少的步骤。 密码是最常见的认证方法&#xff…