MiniGPT-4引领潮流,GPT-4提前发布图片阅读功能

AI中文站翻译自medium.com

让我们来看看如何玩Minigpt-4并将其应用到日常生活中。

今年三月,OpenAI 宣布了 GPT-4 的图像识别功能,这意味着 GPT 技术又被提升一个维度。-4 尚未发布给大众使用很长时间,所以终于有人忍不住了!来自阿拉伯的一家大学,教授带领学生组成研究团队,本月首先推出了 MiniGPT-4,公开让大众使用。我们可以第一次体验 GPT 识别图片的能力,接下来我会带你一起看看 MiniGPT-4 能如何!

它可以用来做什么?

让他帮助您撰写基于即将发布或用于营销的产品照片的营销文本。这太糟糕了。如果这项技术更加成熟,不知道将有多少行业兴衰荣辱。这取决于您是使用它还是被使用。

它还可以让你在白板上编写程序要求并发送图片,它将自动为您完成完整的HTML文件!

你甚至可以向它发送你新鲜烹饪的热腾腾的饭菜图片,让它看看并评论你的烹饪。

传递你所制作的 logo,请求它给予一些意见和评论,看看需不需要加强改进,否则它会毫不留情地批评你。

这件事非常有趣,你可以把它交给他阅读漫画,让他告诉你漫画的内容,甚至你可以自己思考,比如使用这项技术将图片自动转换为文本,这样他就可以读图片并讲故事了。成为一个有着自己想象力的真正的创作者。

如何快速开始体验MiniGPT-4?

说了那么多,你现在一定很想使用吧。下面的链接将带你走过时代之门。点击它,你可以试用他的公共演示版本MiniGPT-4,当然因为它是试用版,所以当你用GPT上传图片或提问时,它会变慢,但你可以放心使用,而且这些都是免费的,你可以享受它带给你的功能体验。点击以下链接体验吧!

Minigpt-4

下面您可以看到其演示版本的操作界面。在左侧,您可以点击并上传图片。上传所需图片后,您可以在下方调整温度参数,以使GPT-4作出不同的回答。简单来说,温度越低,他的回答将更具预测性和保守性。相反,温度越高,他的回答将更具创意和意外性。

对于图像识别任务,Beam Search 中更大的 K 值意味着模型将尝试更多的识别可能性,可能会生成更多的可能标签,从而产生更加多样化和有创意的结果。但同时,这也会增加计算量和存储空间的需求。因此,在选择 Beam Search 参数时,需要根据任务的具体要求和可行性考虑 K 值。

在调整参数并上传图片后,您可以通过它旁边的聊天框输入您想问 GPT 的有关该图片的问题,并让 GPT 基于您的图片与您交互。

他是如何让GPT识别图片的?

MiniGPT-4是一种语言模型,已在识别图片方面取得良好的结果。为实现MiniGPT-4,图像编码器已与开源语言模型Vicuna集成,两者的大多数参数已被冻结,只剩下一个小部分需要训练。Vicuna的传统预训练阶段可在4个A100s使用10小时内完成,这使得Vicuna可以理解图像,但影响了其生成能力。为了解决这个问题,该团队通过让MiniGPT-4与同样开源的ChatGPT合作创建了一个高质量的数据集,包括3500个图像和文本。通过新数据集的微调,大大提高了模型的生成可靠性和整体可用性,并且计算效率高,只需要单个A100花费7分钟。想要了解更多,请看下一条。

就是这样。😉

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/15206.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MiniGPT-4 模型学习与实战

1 前言 MiniGPT-4 是一个冻结的视觉编码器(Q-Former&ViT)与一个冻结的 文本生成大模型(Vicuna,江湖人称:小羊驼) 进行对齐造出来的。 MiniGPT-4 具有许多类似于 GPT-4 的能力, 图像描述生成、从手写草稿创建网站等MiniGPT-4…

QLoRA:一种高效LLMs微调方法,48G内存可调65B 模型,调优模型Guanaco 堪比Chatgpt的99.3%!

引言 本文是华盛顿大学刚刚发布的一篇文章。作者提出了QLoRA,它是一种「高效的微调方法」,可以在保持完整的16位微调任务性能的情况下,将内存使用降低到足以「在单个48GB GPU上微调650亿参数模型」。QLORA通过冻结的4位量化预训练语言模型向低秩适配器(LoRA)反向传播梯度。…

Prompt Learning: ChatGPT 也在用的 NLP 新范式

编者按:自GPT-3以来,大语言模型进入了新的训练范式,即“预训练模型Promp learning”。在这一新的范式下,大语言模型呈现出惊人的zero-shot和few-shot能力,使用较少的训练数据来适应新的任务形式。最近火爆出圈的ChatGP…

《花雕学AI》新版必应 Bing 登场:轻松注册,一站式搜索、聊天与绘画应有尽有

引言: 你是否曾经在网上搜索信息时感到困惑或沮丧?你是否曾经想要在网上创造一些有趣或有用的内容,却不知道从何开始?你是否曾经想要用文字描述一个图像,却无法找到合适的图片?如果你的答案是肯定的&#x…

如何利用ChatPDF快速阅读英文论文,帮你写作业

英语渣狂喜~确实惊艳到我了! 大家好,我是老表 使用平台:https://www.chatpdf.com/ 1、上传PDF 访问官网:https://www.chatpdf.com/,界面很美,点击直接上传 PDF, 需要注意免费版本PDF…

GPT4All: 一个基于大规模数据训练的聊天机器人模型

微信改版,求求大家星标下公众号, 不然后面推送大家可能会看不到 大家好,我是老表,今天给大家分享的是一个开源项目:GPT4All 随着人工智能技术的不断发展,聊天机器人已经成为了一个备受关注的研究领域。在这…

ChatGPT提问的万能公式,强烈建议收藏!泰裤辣!

在实际使用GPT的时候,并不是GPT不够强大,而是我们需要很多时间去调教AI,以便输出我们期望的答案,为了让输出无限的靠近你的期望,就需要下面这个万能的框架,如果大家记不住这个框架或者没有形成习惯&#xf…

老黄因ChatGPT大赚311亿/ 中国移动公布实名NFT交易专利/C919首航航班确定...今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大噶好~今天是兔年首个要上班的周一。 不知各位打工人从假期中缓过来了嘛?(虽然可能已经上了两天班) 日报君在此祝大家新的一年里工作顺利,并在此奉上今日份科技趣闻(为您精…

吴恩达给ChatGPT泼冷水/ 罗永浩谈欠薪/ 谷歌元老离职... 今日更多新鲜事在此

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大噶吼~今天是2月17日星期五。 又到一周工作日的尾巴了,各位想好周末怎么欢度了嘛? 在出去嗨皮/回家睡觉之前,不妨来和日报君看一看科技趣闻——讲真,挺有趣的。 OpenAI计划纠正ChatGPT…

银行数字化转型导师坚鹏:ChatGPT解密与银行应用案例

ChatGPT解密与银行应用案例 ——开启人类AI新纪元 打造数字化转型新利器 课程背景: 很多企业和员工存在以下问题: 不清楚ChatGPT对我们有什么影响? 不知道ChatGPT的发展现状及作用? 不知道ChatGPT的银行业应用案例&#…

关于大模型实践的一些总结

随着ChatGPT的迅速出圈,加速了大模型时代的变革。对于以Transformer、MOE结构为代表的大模型来说,传统的单机单卡训练模式肯定不能满足上千(万)亿级参数的模型训练,这时候我们就需要解决内存墙和通信墙等一系列问题&am…

OpenAI 遭遇离职潮:员工对 ChatGPT 进展缓慢失望,痛批 CEO 不务正业

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年6月份全网热门报告合集 普通人如何利用ChatGPT变现赚钱? 无需翻墙,无需注册,ChatGPT4直接使用 ChatGPT提词手册,学完工…

近期AI成为热点话题, ChatGPT, GPT4, new bing, Bard,AI 绘画, AI 编程工具引发大量讨论。请结合自身学习经历,一起来聊聊你对 AI 技术以及其今后发展的看

1,你人生中第一次接触到“人工智能”的概念和产品是什么?什么让你觉得“人类做的东西的确有智能”? 天猫精灵/小度智能语音音箱。科技越来越发达,一些年龄大的老人并不能够跟上时代的步伐。平时爸妈要上班,我和弟弟要上…

​从底层技术分析如何调教你的ChatGPT?

相信很多人都已经在使用类ChatGPT的工具进行工作或者娱乐了,这里说的类ChatGPT的是指和ChatGPT相同或者相似功能的产品,包括国外的开源平替模型、百度的文心一言等,但是你真的会使用这些工具和应用吗?你使用的方法是正确的吗&…

从ChatGPT的成功看中美创新模式的差异

我在大约三个月前撰写了文章《三分钟读懂新一代人工智能——ChatGPT》,当时ChatGPT的用户刚刚突破一百万,相对来说还较为小众,在资本市场还没有引起关注和追捧。三个月后,这个产品开始进入大众视野,按照瑞银的统计,月活跃用户数已经突破了一亿。如果有投资者在三个月前开…

奥特曼系列ol2020服务器,奥特曼系列ol2020

奥特曼系列ol2020比较好玩的一个系列,游戏玩法里面还原了真实的奥特曼场景带给你回忆感,奥特曼系列ol2020游戏众多人物角色可以选择,跟随着剧情进行体验,奥特曼系列ol2020喜欢的可以下载。 奥特曼系列ol2020游戏特色 1、每一个奥特…

基于Pyramid Vision Transformer(PVT-v2)实现奥特曼识别

前言 大家好,我是阿光。 本专栏整理了《PyTorch深度学习项目实战100例》,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集。 正在更新中~ ✨ 🚨 我的项目环境: 平台:Windows10语言环境:python3.7编译器:PyCharmPy…

奥特曼打小怪兽python代码简单版_奥特曼打小怪兽

from random import randint # 导入randint函数 class Monster(object): def __init__(self, name, energy): self.name name self.energy energy if self.energy > 100: print(self.name "满血战斗") else: print(self.name "目前有" str(self.en…

奥特曼html代码,和平精英捏脸代码奥特曼

和平精英自从更新的新的捏脸玩法之外,玩家们就发明出来了各种各样的脸型,除了明星、小丑之外,还有大家喜爱的奥特曼!最近万几门被奥特曼的信息疯狂洗脑,还去重新看了一遍奥特曼,回忆自己的童年,…

《李宏毅深度学习笔记》开源了!AI界最热视频老师!新增ChatGPT内容

Datawhale开源 开源项目:LeeDL-Tutorial,作者:杨毅远 导读 大家都对于李宏毅老师已经很熟悉了,他用幽默风趣的语言带领大家入门深度学习,旨在向学习者介绍深度学习的基本概念、方法和实践技巧。更可贵的是&#xff0c…