华人团队迷你GPT-4抢跑看图聊天:OpenAI有的它都有,服务器已被挤爆

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。

MiniGPT-4来了,Demo开放在线可玩。

传一张海鲜大餐照片上去,就能直接获得菜谱。

046c6f28857871d459b4ac52c3fd07a4.gif

传一张商品效果图,就可以让AI写一篇带货文案。

b816a67c4c6f9a55e897d1ed34176bb6.gif

手绘一个网页,可以给出对应的HTML代码
1608e1c1f4b8d06d3e9364535f16abf6.gif

除了生产力拉满,也支持根据常识推理图上内容是否合理、解释表情包为什么好笑,以及看截图找电影等娱乐玩法。

a165daf7d54cc532b7a9d4a86190c321.png

可以说,GPT-4发布时展示过的功能,MiniGPT-4基本也都有了。

这下网友直接把Demo服务器挤爆,开发团队连开4台备用服务器,都有几十人在排队。

46b34d8833376dd1c9c6ef2cfb7ca02b.png

不等OpenAI了,现在就能玩

除了研究团队给出的示例,网友也用MiniGPT-4玩出了各种花样

有人上传自己画的画,让AI评价评价。

8658c629851e45a3dd47622be29e446d.png

有人上传一张从车道拍摄的飞机坠毁瞬间,让MiniGPT-4尽可能详细地描述,并思考自动驾驶AI能不能理解这个场面。

674c436dd3d2e52900f2f2676ef45a62.png

做到这么好的效果,MiniGPT-4实现起来却并不复杂。

把图像编码器与开源语言模型Vicuna(小羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。

传统预训练阶段,使用4张A100在10个小时内就可完成,此时训练出来的Vicuna已能够理解图像,但生成能力受到很大影响。

为解决这个问题,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。‍

用新的数据集微调可以显著提高模型的生成可靠性和整体可用性,而且计算效率很高,使用单个A100只需要7分钟。

e213ba75e52d90714f23fc1e87bd710b.png

并且团队正在准备一个更轻量级的版本,部署起来只需要23GB显存。

也就是消费级显卡中拥有24GB显存的3090或4090就可以本地运行了。

MiniGPT-4开发团队来自KAUST(沙特阿卜杜拉国王科技大学),包括4位华人成员和他们的导师 Mohamed Elhoseiny。

60b948ddcf430a6d007187c80e56385f.png

两位正在读博的共同一作还在GitHub页面上特别标注正在找工作

有意向的公司要抓紧抢人了~

在线Demo:
https://minigpt-4.github.io

开源代码:
https://github.com/Vision-CAIR/MiniGPT-4

论文:
https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

《中国AIGC算力产业全景报告》征集启动

AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?

量子位《中国AIGC算力产业全景报告》《最值得关注的AIGC算力玩家》正式启动对外征集,期待有更多优秀的机构产品、案例与技术能够被大众看到。

42d9fce9fe79accd31f4b687829a5f0c.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/11654.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

聚观早报 | 百度文心一言被用户挤爆;贝莱德准备竞购瑞信

今日要闻:百度文心一言被用户挤爆;贝莱德准备竞购瑞信;Meta 在美国推出付费加「蓝 V」服务;三星正开发 3500ppi 的 FMM;老干妈冰激凌要来了 百度文心一言被用户挤爆 百度正式发布了自己的 AI 大模型文心一言&#xff…

当CRM遇见ChatGPT,AI如何帮销售打造“最强大脑”

导读:这一轮AI浪潮将对CRM企业带来哪些新机遇? ChatGPT诞生至今不过100多天,但它已经对很多行业产生了巨大影响。 企业直面市场的一线战场——销售、营销、客服等领域也是如此。以ChatGPT为代表的人工智能技术热潮正在改变着传统营销、销售的…

如何用 10 种策略改进 ChatGPT 的人工智能

你是否曾有过和AI机器人交互无果的经历?或许只是因为提示语的问题!想要ChatGPT/Bard/Bing Chat等AI机器人更智能、回应更高效? 必须学会AI提示语技巧!本文将深入解析如何用精准的语言编写提示,让您的AI聊天机器人更进一步。 为什…

ChatGPT与数据挖掘:洞察消费者行为,优化营销策略

随着科技的不断进步和数字化时代的到来,企业们越来越意识到数据的重要性。在零售和电子商务行业,了解消费者行为并准确洞察其需求,是成功营销和提升业绩的关键。而现在,借助人工智能技术中的ChatGPT以及数据挖掘技术,企…

苹果禁用ChatGPT,为防机密泄露!大模型版Siri即将升级推出

明敏 杨净 发自 凹非寺量子位 | 公众号 QbitAI 前脚ChatGPT刚刚上线iOS嗨翻全球,火速霸榜APP Store; 后脚却曝出消息——苹果自家员工不能用ChatGPT,而且已经好几个月了。 这事儿马上引发巨大讨论。 要知道,从ChatGPT趋势到来后&a…

Midjourney|文心一格prompt教程[Text Prompt(上篇)]:品牌log、App、徽章、插画、头像场景生成,各种风格选择:科技风、运动风

Midjourney|文心一格prompt教程[Text Prompt(上篇)]:品牌log、App、徽章、插画、头像场景生成,各种风格选择:科技风、运动风 1.撰写 Text Prompt 注意事项 Midjourney 跟 ChatGPT 在 prompt 的使用上有很多不一样的地…

GPT4来了,多模态模型上线

目录 文章目录 目录 一、GPT4来了!二、什么是多模态?三、GPT-4有多强?更多玩法等你来看:3.1 更加人性化,更具创意的回答:3.2 图像描述生成:3.3 可视化输入: 文字与图片结合输入3.4 更…

GPT-4掀起智能革命浪潮,AI风口下将涌现哪些新机遇?

本文已同步发表至公众号:https://mp.weixin.qq.com/s/kTMhMZQ-nfIbbeeXLnDeyA 编辑:AGI之心 3 月 15 日,OpenAI 发布 GPT-4 多模态大模型,支持文本和图像输入,相比前段时间大火的ChatGPT在字数上限和回答准确度等各方面…

2023 hnust 湖南科技大学 大三下 嵌入式 期中考试复习笔记

前言 ★:重点✦:猜测考点,自己瞎画了很多※:补充内容❓:还没搞懂的内容主要来源:教材、PPT、百度百科、AI重点来源:4-6班感谢:lyf,lqx总结得很草率,因为没听…

408 计算机考研-001-C语言-C语言基础-考研必学

408 计算机考研-001-C语言-C语言基础-考研必学 本文目录 408 计算机考研-001-C语言-C语言基础-考研必学考研C语言应掌握的内容考研真题2022 年考研真题第 1 题2022 年考研真题第 41 题2021 年考研真题第 42 题 一、打印:Hello, World二、数据类型1. 基本数据类型 三…

因为AI,我被裁了;MJ设计海报全流程;独立开发者每周收入2.3K美元;MJ常用参数超详细介绍 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🤖 受 AI 影响,这 8 家公司开始裁员…… 为了搞清楚 AI 最近在影响哪些行业、哪些职业,作者花了三天事件找到了八…

AIGC 语言大模型研究报告

AIGC 研究报告 这份报告可以被划分为两大部分。 第一部分集中于ChatGPT的发展和运作原理,为了增强理解,我们将先探讨自然语言处理的历史发展。第二部分主要聚焦于由大模型引领的新的研究领域,并深入介绍在每个领域中可以进行的具体研究工作…

ChatGPT编造假新闻,百家号非法获利!

我是卢松松,点点上面的头像,欢迎关注我哦! 看来国内第一个“利用ChatGPT谋利”的案件已经出来了。说通俗点,他就是用ChatGPT乱编热点新闻,然后百家号发文章点击获取收益,然后被定性为涉嫌寻衅滋事罪&#…

如何识别 ChatGPT 的真假

ChatGPT 面世惊艳,无数普通人都想试试看,这个传闻中超级厉害的人工智能到底是怎么回事。一时间,很多网站、群聊中,都冒出来各式各样的打着 ChatGPT 名义,挂着 ChatGPT 头像的人工智能对话机器人。但试着一聊&#xff0…

上海交大全球午餐会——大语言模型机器学习ChatGPT(主讲人:赵海)

实现强人工智能,从脑计划到与训练模型:在过去的十年中,一段时间很热,后面被人工智能机器学习盖过去了 目前脑计划的现状不能宣布失败,仍在进行,但是没有之前那么热。预训练模型正在走向脑计划的方向。 特别…

百度“文心一言”大模型(ERNIE)发布了,对标ChatGPT

大家好,我是微学AI,今天给大家介绍一下基于大语言模型的背景下,国内外的发展现状,以及百度的“文心一言”大模型。 一、自然语言处理模型的发展 自然语言处理(NLP)大模型的发展可以追溯到早期的简单的规则模型,再到后…

百度版ChatGPT将提前上线/ 快手辟谣「宿华最新创业或是芯片」/ 北京支持头部企业打造ChatGPT竞品…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是普普通通平平常常的2月14日星期二。 科技圈最近都有哪些新鲜事,来和日报君一起康康~ 北京:支持头部企业打造对标ChatGPT的大模型 ChatGPT的火,在国内越烧越旺了…

百度即将推出的“文心一言”对标ChatGpt?

百度即将推出的“文心一言”对标ChatGpt? ChatGpt是最近备受关注的一个风口,它由Openapi开发的自然语言处理模型,可以为人类带来极大的便利,前几期小编 也出过几篇关于ChatGpt的文章,相信大家在体验ChatGpt的过程已经感受到了它…

百度中国版ChatGPT“正式问世”

百度中国版ChatGPT正式问世,这是百度自然语言处理方面的重大突破,也是AI领域的一次跨越。ChatGPT是百度自然语言处理技术的升级版,其核心是“GPT”,即“Generative Pre-training Transformer”,是一项基于深度学习的自…

chatgpt是哪家的 chatgpt中的gpt是什么意思

这篇文章主要介绍了一个有趣的事情,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获,下面让小编带着大家一起了解一下。 1、chatgpt是什么? chatgpt介绍如下: ChatGPT是由人工智能研究实验室OpenAI在…