微软开源Visual ChatGPT,7天斩获2.2万stars

点击“开发者技术前线”,选择“星标”

让一部分开发者看到未来

来自 | OSC开源社区(ID:oschina2013)

除了大力投资 Open AI ,微软还亲自下场大搞 AI 。7 天前,微软开源了 Visual ChatGPT ,这个软件可以连接 ChatGPT 和一系列视觉模型,以实现在 ChatGPT 的聊天过程中发送和接收图像。

众所周知,尽管 ChatGPT 的功能非常强大,甚至可以用来写小说写论文,但目前也仅限于文字交流。但表情包早已成为日常文本聊天不可或缺的功能。

Visual ChatGPT 的出现,就像在以文字交流的 APP 中首次添加了表情包功能,而且还是根据用户输入的文本自动生成的 “定制化表情包”,大大提升了 ChatGPT 的趣味性和应用领域。

e82284477570d101452215d7891a89e5.gif

一方面,ChatGPT(或 LLM)充当通用界面,提供对图像的理解和用户的交互功能。另一方面,基础图像模型通过提供特定领域的深入知识来充当背后的技术专家。

仓库中列出了技术架构及原理图:

58e1ce9d43c163659562ff623a8705fc.jpeg

Demo 中共进行了三种不同类型的对话,分别是 Visual ChatGPT 接收用户的图像、Visual ChatGPT 根据用户的文本修改图像并发送给用户,以及 Visual ChatGPT 识别图片,并回答用户的提问。Visual ChatGPT 会根据用户的输入,判断是否需要使用 VFM  (Visual Foundation Model,视觉基础模型)来处理该问题。

仓库中还给出了 Visual ChatGPT 所使用的图像模型和显存使用情况:

61152fb5e54367ec0082ad743fbccd5b.png

更详细的内容可以阅读 Visual ChatGPT 的 arxiv 论文:https://arxiv.org/abs/2303.04671

Visual ChatGPT 在 3 月 10 日发布,截至 3 月 16 日早 15 点,该项目已暂获 21.9K Stars ,可谓是火箭式上涨。

ba2e139830b3691f85263bb6765fc153.png

相关链接:https://github.com/microsoft/visual-chatgpt

— 完 —
点这里👇关注我,记得收藏订阅哦~

历史推荐

重磅!百度发布文心一言!对比 GPT-4现场实测,股价大跌10%,百度背水一战?

Docker翻脸暂停账户,强制收费,不再开源!

前端已死?2023 年前端十大 Web 趋势

好文点个在看吧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16985.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 类 AI 软件供应链的安全及合规风险

AIGC 将成为重要的软件供应链 近日,OpenAI 推出的 ChatGPT 通过强大的 AIGC(人工智能生产内容)能力让不少人认为 AI 的颠覆性拐点即将到来,基于 AI 将带来全新的软件产品体验,而 AI 也将会成为未来软件供应链中非常重…

chatgpt赋能python:Python整人代码:让你的朋友大跌眼镜

Python 整人代码:让你的朋友大跌眼镜 Python 是一种强大的编程语言,常用于开发各种应用程序。然而,除了正常的开发工作之外,Python 还可以用来整人。通过一些简单的代码,你可以让你的朋友在屏幕前大跌眼镜。在本篇文章…

认知智能浪潮将至,企业技术底座和业务流程变革在即 | 爱分析报告

报告编委 黄勇 爱分析合伙人&首席分析师 李进宝 爱分析高级分析师 陈元新 爱分析分析师 外部专家(按姓氏拼音排序) 何敏 明略科技集团 副总裁 尤辉 竹间智能 售前经理 周宁捷 拓尔思 金融和产业大脑产品中心总经理 特别鸣谢&#xff0…

2023年医疗健康企业CRM选型与应用指南

全国两会期间,作为医疗行业建设重点之一的“医疗信息化”受到关注,推进“智慧医疗”体系建设、推进健康医疗数据共享等成为热门议题。 事实上,随着人工智能、大数据等新兴技术的不断成熟、推广与应用,传统医疗行业正在经历数字化…

2023年2月份报告合辑 附下载

时光它总爱不言不语,不经意间又悄悄溜走。一年数它最短的二月,在春暖花开之际,就要和三月交班。二月再见,三月你好!早春从这里开始,未来在此刻启程。又在宛若初见的时光里,轻声念起:三月&#x…

【社区图书馆】【图书活动第四期】

目录 一、前言 二、作者简介 三、《PyTorch高级机器学习实战》内容简介 四、书目录 一、前言 今天,偶尔逛到csdn社区图书馆,看到有活动 “【图书活动第四期】来一起写书评领实体奖牌红包电子勋章吧!”(活动到今天结束&#xf…

YOLOv5全面解析教程⑧:将训练好的YOLOv5权重导为其它框架格式

撰文|FengWen、BBuf 1 模型导出 这个教程用来解释如何导出一个训练好的OneFlow YOLOv5模型到 ONNX。欢迎大家到这里查看本篇文章的完整版本:https://start.oneflow.org/oneflow-yolo-doc/tutorials/06_chapter/export_onnx_tflite_tensorrt.html 2 开始…

2023西湖论剑RE--BabyRE

用IDA打开附件,搜索字符串发现“Good, flag is DASCTF{your input}”字符串 一直交叉引用,发现以下三个函数 下面分析中的部分函数名,变量名和变量类型我做了修改 一、sub_401000函数 该函数先调用sub_401170函数,然后注册了一个退…

AIGC专题二:ChatGPT更懂人类的叙事

ChatGPT是OpenAI推出的聊天机器人模型,月度用户已破亿,正在逐步探索商业化途径。ChatGPT能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚…

【ARMv8/v9 异常模型入门及渐进2 - 系统控制寄存器 SCTRL_ELx 介绍】

文章目录 SCTRL_ELx 介绍背景ARMv8 SCTLR_ELx 介绍ARMv9 SCTLR_ELx 介绍 SCTRL_ELx 介绍背景 由于在做DFD 测试过程中需要测试 EL1 状态下的 self-hosted trace 功能,但是这个测试是在UEFI中做的,在开发验证阶段UEFI默认是运行在EL3 下的,所…

关于UVC设备拥有两个/dev/video*节点的原因以及来历?

在ubuntu18.04/ubuntu16.04系统上,插入UVC设备,你会发现V4L2框架替它创建了两个video设备节点,分别是 /dev/video0, /dev/video1: 经过实际测试,可以通过/dev/video0获取图像,但是无法通过/dev/video1获取图像,具体的试验请看下面两篇博客: V4L2子系统架构设计初探 美…

从千亿模型到ChatGPT的⼀点思考

近年来人工智能的快速发展受到社会各界的广泛关注,超大规模预训练模型取得了突飞猛进的进步。唐杰从OpenAI发布的大规模自然语言预训练模型GPT-3谈起,详细介绍了大模型的进化史,及其所表现出来的能够更好处理现实世界复杂性问题的能力与可能性…

230502-LLM-Vicuna介绍、安装与注意事项整理

排名模型Elo 得分描述许可证1🥇 GPT-41274OPENAI 公司:ChatGPT-4OpenAI公司专有2🥈Claude-v11224Anthtopic 公司:ClaudeAnthtopic公司专有3🥉 GPT-3.5-turbo1155OPENAI 公司:ChatGPT-3.5OpenAI公司专有4⭐️…

ChatGPT又为我省了一笔钱

作为家长你可能会关注。我周围的朋友,一般都会请外教来帮助孩子提高英语口语能力。然而,外教的费用不菲,这也成为了很多人的负担。但现在,有了ChatGPT语音插件,我们可以省下雇佣外教的钱,而又能有效地提高英…

跟着ChatGPT手把实现一个websocket连接管理器! 毛骨悚然

全是贴图了: 多说无益!!! 开始: 实现一个某安的连接管理: 其中步骤1到7列的明明白白,而且一开始就提出了要有connectionManager,这已经是很职业的方式了,至少不是学生气&…

2023 商业化ChatGpt Web源码

简介 一款使用React搭建的一款可商业化的ChatGpt Web应用,支持接入支付宝当面付及易支付 主要功能 后台管理系统,可对用户,Token,商品,卡密等进行管理精心设计的 UI,响应式设计极快的首屏加载速度(~100kb)支持Midjourney绘画和DALLE模型绘…

基于ChatGPT的文档知识库客服系统-支持上传网址/文本/docx等数据

现在,很多公司都有自己的内容知识库,会产生大量的碎片话的内部知识,但是这样内部知识难以整合搜索。 我开发的文档知识库客服系统 gofly.v1kf.com ,可以应用于企业内部知识库管理,用户可以使用自然语言提问&#xff0c…

学编程一定要数学很好吗?看到网友这样说,我松了一口气 ...

学好数理化,走遍全天下!小时候,这句顺口溜时常在耳边响起,而迈入编程行业以后,又有人想问:我数学不好,能写好代码吗? 不过最近的 MIT 神经科学家在 eLife期刊发表了一项新研究&#…

答读者:数学不好,能学好算法吗?

点击关注上方“五分钟学算法”, 设为“置顶或星标”,第一时间送达干货。 转自是不是很酷 这是在我的知识星球上,一个同学问我的问题。 波波老师您好。 我今年 28 了,也算是科班出身,但是大学的时候基本没怎么上过课。毕…

5小时掌握提示词工程,写出高价值大模型Prompt!中文!免费!

写出优质的提示词,让AI生成惊艳的图文作品。 ——这就是如今年薪百万仍一人难求的提示词工程师们在解决的问题。大语言模型时代下,不断涌现出众多让人瞳孔地震的绘画、拍案叫绝的文案,它们的创作者并非传统定义的画家、作家,而是这…