MiniGPT4,开源了!

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

GPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。

MiniGPT-4来了,Demo开放在线可玩。

传一张海鲜大餐照片上去,就能直接获得菜谱。

ff963e02646ada9271a130aac885e40d.gif

传一张商品效果图,就可以让AI写一篇带货文案。

94592fd7073382aa3265d6269d1240bc.gif

手绘一个网页,可以给出对应的HTML代码
be8e17fab096672b108b86c5d23c4806.gif

除了生产力拉满,也支持根据常识推理图上内容是否合理、解释表情包为什么好笑,以及看截图找电影等娱乐玩法。

b50c4a1ea7fddbfa7dfa98a3bc91ed7e.png

可以说,GPT-4发布时展示过的功能,MiniGPT-4基本也都有了。

这下网友直接把Demo服务器挤爆,开发团队连开4台备用服务器,都有几十人在排队。

6e8e13711bed3640845ba1459c5645bd.png

不等OpenAI了,现在就能玩

除了研究团队给出的示例,网友也用MiniGPT-4玩出了各种花样

有人上传自己画的画,让AI评价评价。

0e1f74abf9be9b9407b8268d83977ac1.png

有人上传一张从车道拍摄的飞机坠毁瞬间,让MiniGPT-4尽可能详细地描述,并思考自动驾驶AI能不能理解这个场面。

b7f1b7e7c06a05f865913dbc5845743c.png

做到这么好的效果,MiniGPT-4实现起来却并不复杂。

把图像编码器与开源语言模型Vicuna(小羊驼)整合起来,并且冻结了两者的大部分参数,只需要训练很少一部分。

传统预训练阶段,使用4张A100在10个小时内就可完成,此时训练出来的Vicuna已能够理解图像,但生成能力受到很大影响。

为解决这个问题,团队让MiniGPT-4与ChatGPT合作创建了3500个图像文本的高质量数据集,也一并开源。‍

用新的数据集微调可以显著提高模型的生成可靠性和整体可用性,而且计算效率很高,使用单个A100只需要7分钟。

47f5c4a76ea2a27dfe5500941a2328dc.png

并且团队正在准备一个更轻量级的版本,部署起来只需要23GB显存。

也就是消费级显卡中拥有24GB显存的3090或4090就可以本地运行了。

MiniGPT-4开发团队来自KAUST(沙特阿卜杜拉国王科技大学),包括4位华人成员和他们的导师 Mohamed Elhoseiny。

17411193341148d647237e5e4de6cd9e.png

两位正在读博的共同一作还在GitHub页面上特别标注正在找工作

有意向的公司要抓紧抢人了~

在线Demo:
https://minigpt-4.github.io

开源代码:
https://github.com/Vision-CAIR/MiniGPT-4

论文:
https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

---完---

为了跟上AI时代我干了一件事儿,创立了一个知识星球社群,想带着大家一起探索ChatGPT和新的AI时代。

现在加入只需199元。5.1号正式涨价恢复2X9元!

386baf4c5f1baf7927ab35c9054bf32f.jpeg

不过随着用户的增长,1字开头的价格肯定就不存在了,所以如果你感兴趣,建议尽早加入越早加入优惠越大!

我们也没有想到 ChatGPT 领域这么强,这么火爆,星球一个多月已经有5800+用户在火热的交流,计划6000+用户涨价,要加入的小伙伴一定要趁早。

早就是优势!早就是优势!早就是优势!执行力执行力执行力!

成为最早一批能驾驭ChatGPT的少数人!不要以现在的样子评判未来。不要以自己现在极其有限的认知评判它,去看看高阶玩家在怎么玩。

最后推荐大家一定要加我的微信,因为最新的活动都会第一时间发布到朋友圈。第一批抢到最优惠的小伙伴,都是在朋友圈第一时间报名加入的。

2862294f60e89c70ba02a49abdad1a26.gif

(加我微信,防止失联!)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28636.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

别再纠结 GPT-4 了,最强平替 MiniGPT4 开源了,完全免费!

ChatGPT狂飙160天,世界已经不是之前的样子。 我新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 GPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。 MiniGPT-4来了,Demo开放在线可玩。 传一…

Midjourney最新「平移扩图」玩法,自定义无限延展,轻松创造超长画卷

尚恩 发自 凹非寺量子位 | 公众号 QbitAI 玩扩图,Midjourney是认真的。 现在只要几个指令,就能轻松创造超长画卷。 我们先来看一张图,这张是原来的图: 这是经过自定义扩充后的效果,是酱婶儿: 这就是Midjour…

文心一言APP国区可下载!免费体验120+玩法,超多新花样!

编辑 | 量子位 点击下方卡片,关注“自动驾驶之心”公众号 ADAS巨卷干货,即可获取 本文只做学术分享,如有侵权,联系删文 终于,正版百度文心一言APP上架苹果商店了! (此前百度因为盗版文心一言APP…

掌握Tampermonkey,让网页玩出新花样

掌握Tampermonkey,让网页玩出新花样 何为Tampermonkey?Tampermonkey有何神通?操作示例 今天我要向朋友们介绍一个超酷的浏览器插件,Tampermonkey。我把它称之为一根神奇的魔法棒,可以让你对网页的玩法、样式和功能实现自定义。 熟…

歌神影帝:搞过数据库的人,职业宽度超乎你的想象

人工智能时代,AI 会取代很多工种,数据处理、数据库运维等等,都会慢慢的演进到自动化时代,ChatGPT 已经为行业带来了深刻影响。 而我们如果不做数据库,还能从事什么岗位的工作呢? 答案可以有:歌神…

人工智能时代,有哪些新的职业机会?

人工智能技术的发展和应用对社会产生的影响非常大,尤其是近期接连而来ChatGPT,GPT4,让很多圈外人都对人工智能产生了更大的兴趣,人工智能技术带给我们方便的同时,也带给了我们焦虑,大家都在思考一个问题&am…

最高年薪近56万!2023最新AIGC就业趋势报告出炉

【导读】猎聘大数据研究院重磅发布《AIGC就业趋势大数据报告2023》,招聘平均年薪已达40万,博士需求量同比增长超100%。 不用赘述,大家都知道,最近半年ChatGPT是有多么火爆。 随着ChatGPT的全球爆火,AIGC也已成功从科…

7800 个工作岗位危矣,AI 对大厂发起“进攻”?

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) “人类工作岗位即将被 AI 所取代”,当这一危言耸听的言论照进现实,从业者过往眼中的“铁饭碗”也将不复存在。 据彭博社报道,IBM 成为首家公开支持 AI 取代人类劳动力…

chatgpt赋能Python-python_contour图

Python Contour图:图像处理和分析的重要工具 Contour图是一种在图像处理和分析中非常常用的工具。在Python的科学计算库中,包括NumPy和Matplotlib,Contour图有着广泛的应用。Contour图的主要作用是用等高线来展示二维区域的数值分布状况&…

chatgpt赋能python:Python中按钮的位置摆放

Python中按钮的位置摆放 在Python应用程序中,按钮是常见的交互元素之一。按钮通常用于响应用户的操作,例如提交表单或执行某些功能。然而,在设计应用程序时,按钮的位置是一个重要的问题,因为它将直接影响用户体验和应…

chatgpt赋能python:Pythonrjust方法的用法及优势

Python rjust 方法的用法及优势 在Python编程语言中,有很多内置方法或函数可以帮助我们更加方便地处理文本、字符串和数字等数据类型。其中,rjust()方法就是一个非常实用的方法,它可以在字符串的左侧填充指定数量的空格或其他字符。本文将向…

chatgpt赋能python:Python桌面编程:探索图形用户界面

Python桌面编程:探索图形用户界面 Python是一种广受欢迎的高级编程语言,被广泛应用于数据科学、人工智能、Web开发和自动化。但是,随着越来越多的应用程序向图形用户界面(GUI)转移,Python的桌面编程能力也…

chatgpt赋能Python-pythonyolo

Python YOLO - 重新定义物体检测 随着人工智能技术的发展,物体检测成为了一项非常重要的任务,而Python YOLO作为一种新兴的物体检测技术,受到了越来越多人的关注。那么,Python YOLO究竟是什么,以及它有何优势呢&#…

树莓派系列-6-Qt控制树莓派GPIO(3B V1.2)

Qt 控制树莓派GPIO ​ 今天来个临时小任务,使用树莓派通过GPIO引脚控制继电器开关。 文章目录 Qt 控制树莓派GPIO系统安装安装Qt树莓派引脚图在Shell中测试在Qt中编码在pro中包含库Cpp代码 实物图资源链接 关键字: 树莓派3B、Qt、GPIO、继电器、控制 系…

树莓派系统的安装教程

大家好,我是爱吃饼干的小白鼠,今天就和大家说说如何安装树莓派的系统。 在这里,我简单介绍一下什么是树莓派? 树莓派(Raspberry Pi)是尺寸仅有信用卡大小的一个小型电脑,您可以将树莓派连接电视…

树莓派使用串口通信(硬件串口)

树莓派使用串口通信(硬件串口) 树莓派3B 树莓派3B内置了一个称之为硬件串口(/dev/ttyAMA0),一个称之为mini串口(/dev/ttyS0)。在树莓派3代中,由于板载蓝牙模块,硬件串口被默认分配给与蓝牙模块…

树莓派串口通信(pyserial)

本次做项目需要树莓派与STM32F4进行串口通信 记录一下过程 需要准备: 树莓派 usb转ttl 杜邦线四根 pc端串口调试助手 1.树莓派串口与TTl连接 先看树莓派引脚图: 图中可以看到 GPIO14 和 GPIO15 分别为TXD RXD 左上角是两个5V的电源 再往下是接地的引脚…

OrangePi香橙派 开启Uart串口

1.WiringPi串口示例程序报错:No Such File or directory 香橙派虽然是一款性价比很高的Linux开发板,但是和树莓派相比,其开发文档、社区资源都相对匮乏,而且很多库都是从树莓派那移植过来的,比如控制IO的库&#xff1…

树莓派GPIO

命令行执行下行,即可得树莓派管脚编码表。 $ gpio readall 也可看下图: BOARD 编号参考 Raspberry Pi 主板上 P1 接线柱的针脚编号。使用该方式的优点是无需考虑主板的修订版本,无需因为版本不同而重新连接线路和更改代码。BCM编号侧重CPU寄存…

树莓派入门(四)之串口通信

刚刚入手了一个树莓派3,其中的资源当然很丰富了,树莓派3有一个I2C,一个Uart,以及一个SPI,这些接口都是我们以后需要连接外围设备的通讯接口,今天就和大家聊一下树莓派相关串口Uart的配置和使用,当然这之前你先需要安装…