如何跟聊天机器人一起绘画?

出品人:Towhee 技术团队 顾梦佳

从AI作画背后的 Diffusion 到智能聊天里的 ChatGPT,生成模型的热潮一浪接着一浪,似乎也预示着超大预训练模型就是人工智能的未来。在万众瞩目的 GPT 4.0 “官宣”之前,微软率先发布融合了大语言模型和大视觉模型的 Visual ChatGPT。智能对话不再局限于文本类的交流,机器人不仅可以“看图说话”,还能沟通作画。不同模态的大模型各有千秋却无一全能,因此它们的结合势在必行。Visual ChatGPT 无疑是一个好的开端,正式开启了以 ChatGPT 为基础的拓展研究。

Architecture of Visual ChatGPT

Visual ChatGPT 没有选择从头训练一个多模态的模型,而是直接让 ChatGPT “汲取”各种大视觉模型的知识。它设计了一系列“提示”(Prompts)将来自 22 个大视觉模型的信息注入 ChatGPT。这些提示会明确告诉 ChatGPT 每个大视觉模型的能力,并指定输入和输出的格式。它们还会将不同的视觉信息转换成语言的形式,以帮助 ChatGPT 更好地理解图像。另外,提示也会帮助处理不同大视觉模型的历史、优先级、冲突。Visual ChatGPT 选择利用这些提示不断迭代来自大视觉模型的反馈,直到满足用户的要求或达到结束条件。经过在许多案例上进行大量的零样本迁移实验,Visual ChatGPT 成功证明了其理解和生成的能力。

相关资料:

  • 项目地址:https://github.com/microsoft/visual-chatgpt

  • 论文链接:Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

  • 更多资料:https://github.com/microsoft/visual-chatgpt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29149.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

科研绘图(编程绘图、网站绘图、配色、素材、提取数...)

配色网站:https://mycolor.space/ 素材网站:https://www.freepik.com/ python:seaborn库:https://zhuanlan.zhihu.com/p/81553421?utm_sourcewechat_session matlab:绘图代码示例:知乎:阿昆的科…

汤姆猫+AI求IP“翻红”?股东年内忙减持

作为初代手机宠物陪伴游戏,“会说话的汤姆猫”曾在全球积累了大量粉丝,汤姆猫IP也成为一代经典。2017年,A股上市公司金科文化将诞生自海外“汤姆猫”收入麾下。你或许不知道,汤姆猫已成为中国A股市场的一只股票代码。 在金科文化…

ChatGPT 驱动的《会聊天的汤姆猫》封测结束,采用生成式 AI 创作美术

金科汤姆猫公司的《会说话的汤姆猫》此前利用 ChatGPT 技术全新打造了《会聊天的汤姆猫》,从技术创新和产品升级的角度来看,这是一次具有积极意义的尝试。但产品功能有所欠缺,且只有安卓平台可用,于 3 月开启封测。 据金科汤姆猫…

Nginx 代理Nexus 页面静态元素(图片)404!

日常踩坑记录。 如果你也遇到了可以尝试修改下看能否改善你的问题。 nginx 旧配置 # Nexus maven 私有仓库location /nexus {proxy_pass http://192.168.128.168:89/nexus;} 访问页面 虽然不影响使用,但是logo 小图标你都不显示,看着不舒服。解决它 …

chatgpt赋能python:Python常见错误及解决方法

Python常见错误及解决方法 Python作为一种非常流行的动态语言,拥有着丰富的库和工具,因其易读性和高效性,被广泛的用于Web开发、数据分析、科学计算等领域。但是,在我们编写Python程序的过程中,也难免会遇到各种各样的…

社区供稿 | 中文 LangChain 项目的实现开源工作

Chinese-LangChain 是 yanqiangmiffy 同学的开源项目https://hf.co/spaces/ChallengeHub/Chinese-LangChainhttps://github.com/yanqiangmiffy/Chinese-LangChain 中文 langchain 项目,基于 ChatGLM-6b langchain 实现本地化知识库检索与智能答案生成。 LangChain …

我们是怎么把1天变成了72小时的?普惠AGIUI开源项目

(想看重播的读者可以翻到文章底部~) 不知大家有没有想过如何把一天24小时的时间变长?还有如何知道自己下一步应该做什么? 现在这些都可以基于大语言模型LLM来帮我们实现(模拟仿真)了,LLM具备推理…

chatgpt赋能python:Python如何创建角色

Python如何创建角色 在游戏开发中,创建角色是非常重要的一个环节,也是游戏设计的重要一环。Python作为一种广泛使用的编程语言,可以用于快速且高效地创建角色。 1. 创建角色的基本思路 创建角色的主要思路是定义角色的属性,包括…

【好用的办公软件】万彩办公大师教程丨标准安装版/绿色免安装版/离线版区别

万彩办公大师标准安装版:下载后,解压,双击安装包,需要像安装普通软件那样,一步步的安装; 万彩办公大师绿色免安装版:下载完,解压,不需要安装,直接双击图中文件…

【电脑常用办公软件】万彩办公大师教程丨全能视频转换工具

关于万彩办公大师的全能视频转换工具 全能视频转换工具兼容Windows操作系统,实现多种视频格式间的流畅转换。支持批量转换视频到其他格式;支持多种输出视频格式,自定义质量和大小,最大程度上满足其想要在不同播放设备上播放视频的…

【免费思维导图软件】万彩脑图大师教程 | 导出导入思维导图模板

在万彩脑图大师中, 你可以轻松导出导入思维导图模板进行保存或编辑,具体操作步骤如下: 一、导出模板 1)单击左上角的“文件“—点击“保存成模板“—输入标题,关键字以及进行高级模板设置—保存 【图1▲】 2&#…

【免费思维导图软件】万彩脑图大师教程 | 贯穿思维导图演示过程的背景音乐设置

添加背景音乐可以赋予思维导图画面感和节奏感,渲染特定氛围,调动观众情绪,使之全身心投入参与到演示之中。您可以在“选项”窗口中为思维导图添加和设置背景音乐。 添加设置背景音乐的具体操作步骤如下: 1. 添加背景音乐 “选项…

【免费办公软件】万彩办公大师教程丨文件批量解压工具

万彩办公大师里的批量解压工具,可批量解压RAR与ZIP格式的压缩文件 。支持拖放导入压缩文件,两种解压方式可选:解压到当前目录和解压到当前子目录。 一、运行文件批量解压工具 通过万彩办公大师,选择“更多办公小工具”——“文件处…

万彩脑图大师教程 | 万彩脑图大师免费注册登录

万彩脑图大师简单易用,功能强大,免费注册登录,即可制作精美生动的思维导图。 下面说说万彩脑图大师免费注册登录的步骤: 1.在官方网页注册 http://www.wmindmap.cn/account/register 或者直接在软件上注册: 打开万…

【办公协作软件】万彩办公大师教程丨全能文档转换工具

关于全能文档转换工具 万彩办公大师的免费全能文档转换工具能转换Office为PDF,无需安装任何插件和工具。拖拽操作就能添加Office文档(.doc(x),.xlsx,.ppt(x))进行一键转换。启动该程序时,以下主界面将显示: 使用全能文…

【办公软件都有哪些】万彩办公大师教程丨PDF图片抽取

万彩办公大师的PDF 图片抽取工具能快速从Adobe PDF 文件中提取图片。提取后的图片可供重复编辑或使用。迅速抽取批量PDF文件中的图片并且可以以多种图片格式进行保存。更有图片尺寸过滤与预览设置,可在保存前清除多余的内容。 无需安装Adobe Acrobat 阅读器&#xf…

【电脑办公软件有哪些】万彩办公大师教程丨图片批量特效处理

关于图片批量特效处理 万彩办公大师的图片批量特效处理工具支持JPG,PNG,GIF等图片格式的批处理。实现图片的批量添加水印、调整色度(对比度,亮度,色彩平衡,尖锐化)、特效设置(模糊化…

【办公协作软件】万彩办公大师教程丨PDF页面排列布局帮助文档

关于万彩办公大师的PDF页面排列布局工具 PDF页面排列布局工具是一款批量创建多页排列PDF文档的桌面应用程序,操作简单,实用高效。A/B,A/C,分割或首-尾,强大的排列方式和页面布局使PDF文档的页面排版美观、专业&#x…

【常用的办公软件】万彩办公大师教程丨PDF文件批量命名

关于万彩办公大师的PDF文件批量命名工具 PDF文件批量命名工具是一款为PDF文档批量命名的桌面应用程序,操作简单,实用高效。使用这款文件批量命名工具可以为PDF文档批量命名,可以自定义新的文件名并预览新名称。 功能介绍: 1. 一…

【什么办公软件好用】万彩办公大师教程丨图像拼接大师的应用

关于图像拼接大师 图像拼接大师拼接批量图片、照片,高质量、多格式(BMP,JPG,PNG,GIF)的图片输出满足分享和打印需求。有4种排列规则自定义图片的拼接排版,设置边框、图片样式和图片缩放&#x…