Chatgpt论文笔记——MiNiGPT4解读

前言

代码地址:https://github.com/Vision-CAIR/MiniGPT-4

摘要

在这里插入图片描述
摘要写的就很简单了,标黄的是重点,可以看到这个方法很简单,就是拿了一个视觉的encoder(Blip-2)以及拿了一个文本的encoder(Vicuna),最后外加上一个projection层就构成了MiniGPT4,并且在训练的时候视觉和文本的encoder都是冻结参数的,所以相当于只是拿视觉和文本的编码器来用,训练只训外加的projection层。

方法

在这里插入图片描述
方法就是说了视觉编码器用的Blip-2,他是由vit+q-former构成的。文本用的是vicuna,基于LLaMA设计的。就当作文本和图像的backbone就好了,具体细节可以不看,基本就是transformer的结构。
然后就介绍了训练的细节,训练分了两个阶段,第一阶段预训练用的是500w的图文对训模型,并且视觉和文本的encoder都是冻结参数的,第二阶段用精修的数据集3500条图文对精调模型参数。

第一阶段预训练

在这里插入图片描述
没啥可说的,介绍了下训练的参数,用了4张A100训500w图文对的数据,训了10个小时。第一阶段训练完作者测试模型发现模型生成的文本有很多重复的,不完整的,没有逻辑的句子,对人类来说阅读是十分不友好的,所以有了第二阶段的精调。

第二阶段训练

数据构建

第二阶段的主要目的是用高质量的图文对数据来消除视觉和语言的领域差异,通俗点说就是让模型说的话更加的人类可读。
构建精修数据集的具体做法如下:

  • 一:从Conceptual Caption dataset随机选择了5000个数据
  • 二:用一阶段训练的模型对这些数据做提问生成答案。
    • 提问的prompt:###Human: Describe this image in detail. Give as many details as possible. Say everything you see. ###Assistant:
    • 如果回答的内容少于80个单词(论文写的token感觉应该差不多意思),就追问,追问的prompt是:###Human: Continue ###Assistant:
    • 然后拼接得到最后的回答,这个回答是详细的图像的描述。
  • 三:这样生成的描述还是存在噪声以及错误的回答(重复的回答,不连贯的回答),接下来用chatgpt来修正这些回答:
    • 输入给chatgpt的提示词为:Fix the error in the given paragraph. Remove any repeating sentences, meaningless characters, not English sentences, and so on. Remove unnecessary repetition. Rewrite any incomplete sentences. Return directly the results without explanation. Return directly the input paragraph if it is already correct without explanation.
  • 四:人工验证图像描述的正确性并且有些chatgpt无法检测的冗余句子也人工修正。最后从5000里面精挑了3500条。

fintune

在这里插入图片描述
finetune就比较简单了,拿3500条精修的数据直接finetune就好了,输入的模版是###Human: ###Assistant:
训练的机器是一张A100,batch size12,跑了400个step。

最后

MiNiGPT4安装记录:MiNiGPT4安装记录

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/375.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

玩转ChatGPT:论文翻译润色

一、写在前面 首先还是让小Chat推销下自己: 嘿!你是否在写论文的过程中感到头疼,无从下手?你是否在担心自己的语言表达不够专业、不够流畅,影响了论文的质量?不要担心,ChatGPT的润色服务可以帮…

Visual ChatGPT论文阅读笔记

Visual ChatGPT论文阅读 做笔记的目的介绍论文贡献Visual ChatGPT总体框架总体流程 实验限制总结 做笔记的目的 1、读完了论文,做一下笔记让自己别忘的那么快 2、蹭一波热度(好像有点晚了) 3、这是第一次看纯工程论文,所以做一下…

ChatGPT论文润色

好像确实不会记住内容 参考文献十分不靠谱 链接1进去 链接2进去

chatgpt论文 chatgpt写论文

ChatGPT作品展示: 当代青少年的生活离不开自媒体,自媒体对当代青少年的影响是巨大的。首先,自媒体为当代青少年提供了一个展示自我的平台,让他们可以更好地表达自己的想法和感受,更好地展示自己的才华和能力&#xff0…

使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少?

使用ChatGPT帮我们写一篇论文,最后查重的重复率会是多少? ChatGpt一经发布就大火,迅速应用在各个领域,尤其在程序圈自动帮我们写代码着实是圈了一大波粉。那么它用在科研领域会出现怎样的效果呢,当我们写论文纠结几个…

如何用ChatGPT辅助写论文

ChatGPT先进功能创造了巨大的需求,该AI工具在推出后的两个月内就积累了超过1亿用户。最突出的功能之一是它能够在几秒钟内编写各种文本,包括歌曲、诗歌、睡前故事和散文。 但是ChatGPT可以做的不仅仅是写一篇文章。更有用的是它如何帮助指导写作过程。今…

【ChatGPT】ChatGPT 原理全解析——读完这10篇论文,你就懂了。

2022年11月,OpenAI推出人工智能聊天原型ChatGPT,再次赚足眼球,为AI界引发了类似AIGC让艺术家失业的大讨论。 ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。其中 GPT 是 Generativ…

建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南+最全提示词/咒语

在这篇文章中,我将分享如何利用ChatGPT 4.0辅助论文写作的技巧,并根据网上的资料和最新的研究补充更多好用的咒语技巧。 本篇文章持续更新,祝大家写作顺利,如果对你有帮助,记得三连! 欢迎大家在评论区补充…

聊聊ChatGPT

ChatGPT 这几周科技圈最火的当属ChatGPT,自媒体中十篇有九篇都是关于ChatGPT的。ChatGPT上可知天文,下可知地理,还可写论文、搞代、写小说,可谓“全能型选手”。自从去年11月openAI推出ChatGPT以来,注册用户不到几周就…

chatgpt这么火?前端如何实现类似chatgpt的对话页面

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言📝…

张俊林:ChatGPT 会成为下一代搜索引擎吗

文|张俊林知乎 这是「进击的Coder」的第 774 篇技术分享 作者:张俊林 来源:知乎 “ 阅读本文大概需要 9 分钟。 ” 本文将从以下几个方面展开: 引言ChatGPT 的技术原理ChatGPT 能否取代 Google、百度等传统搜索引擎 引言 作为智能对话系统&a…

ChatGPT终于被缝进了搜索引擎…

文|Alex Pine 发自 凹非寺源|量子位 见惯了列表式搜索引擎,你有没有想过给它换种画风? 有人脑洞大开,把艳惊四座的ChatGPT和必应搜索结合起来,搞出了一个智能搜索引擎: 既有ChatGPT式的问答&…

提升搜索效率-----使用chatGPT插件让搜索结果直接展示在谷歌界面右侧

今天分享一个chatGPT的进阶玩法,使用谷歌浏览器插件的形式,将chatGPT植入到浏览器的搜索结果内。 而chatGPT会将你的搜索问题的结果,同步展示在谷歌搜索界面的右侧。 但还是要注意科学上网!!但毕竟谷歌也需要科学才能挤…

重磅!微软推出首款 ChatGPT 版搜索引擎!

微软近期推出了首款 ChatGPT 版搜索引擎,今天带大家一起来看一下。 一夜之间,全球最大的科技公司仿佛都回到了自己年轻时的样子。 在谷歌宣布「实验性对话式人工智能服务」Bard 之后仅 24 小时,北京时间 2 月 8 日凌晨两点,微软发…

将ChatGPT集成到搜索引擎上(稳定版)

前言: ChatGPT已经火了有一段时间了,针对它的各种工具也层出不穷,笔者今天推荐的是一款google插件ChatGPT for Google,它是一款将ChatGPT集成到Google浏览器的插件,支持大多数搜索引擎,可能有些人已经使用过&#xff0…

Gmail 之父:有了 ChatGPT,搜索引擎活不过两年了

【导读】Gmail创始人表示:再有两年时间,ChatGPT将彻底摧毁谷歌赖以生存的搜索引擎,就像当年搜索引擎彻底干掉黄页电话簿一样。 从ChatGPT横空出世的那天起,微软应该感到庆幸。 除了庆幸自己几年前的10亿美元没白投之外。更重要的…

神奇智能搜索引擎:perplexity智能搜索引擎(ChatGPT与Edge合体——联网版chatGPT)

目录 前言一、Perplexity AI网站介绍二、优点介绍2-0、界面介绍2-1、纯净、时效性、来源说明2-2、基于AI对话形式的搜索引擎 三、使用方法介绍总结 前言 ChatGPT背后的语言大模型OpenAI GPT 3.5,和微软的必应检索系统整合在一起;同时吸取这二者的长处&am…

ChatGPT热炒之前 搜索引擎SEO算法已经悄然改变

2022年4月起,某度算法有了新的调整,这对于靠SEO获得流量的公司简直可以说是灭顶之灾。原本SEO从业者还指望跟之前一样,等算法调整稳定后,网站的自然排名还会再回来,但等到了10月份,仍然没有回暖的迹象&…

谷歌急了,搜索引擎被ChatGPT颠覆的可能性

社区成员正在热议👇 The Generalist最近发了一篇文章:主要讲了关于谷歌、ChatGPT和搜索的未来。其中探讨了几个问题:自去年年底ChatGPT推出以来,OpenAI产品一直被誉为是:搜索的未来,也是潜在的谷歌杀手。那…

ChatGPT取代搜索引擎?谷歌急了,百度不慌:早已布局

梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI 生成式AI要取代搜索引擎的声音,出现在ChatGPT发布的第一天。 后来越传越邪乎,有人设想以后大家找资料都不说google一下了,而是geept一下。 还有人说,搜索引擎给的一页10个蓝蓝的链接…