GPT-4原论文详细解读(GPT-4 Technical Report)

GPT-4原论文详细解读(GPT-4 Technical Report)

返回论文和资料目录

1.导读

相比之前的GPT-3.5等大型语言模型(这里可以看我的InstructGPT解读,也方便理解本文内容),GPT-4最大的不同在于变成了多模态,即输出不变的情况下,输入可以为图片或文本。其展现了优于ChatGPT模型并且非常强大的性能。读者可在OpenAI官网体验体验,不过网页端只提供了文本输入,图片输入的方式目前只支持API。

2.摘要和引言

GPT-4是一个多模态的大模型。它的基础结构仍然是Transformer+预测下一个词的目标函数。

GPT-4在摘要中的说法是给出了一个预测模型性能的方法,使得只需要0.1%的训练计算资源,就可以预测模型的性能了。不需要训练到最后才得到模型性能,这有助于早期就调整好模型,减少不必要的训练成本。

GPT-4这篇工作目的是增强理解生成文本的能力,尤其在复杂且存在细微差异的场景。

GPT-4使用了很多人类的考试(例如,律师资格考试)和传统的NLP任务作为测试案例。

GPT-4仍然存在之前工作中的一些问题:1.会瞎编,缺乏可靠性。2.限制25000字。3.无法从经验中学习。

3.论文结构

  • 第3节:本文的内容涉及范围
  • 第4节:预测技术(预测模型性能相关技术,使得用少数的训练就能预测模型的性能),这部分本篇博客跳过
  • 第5节:详细介绍GPT-4的能力,实验
  • 第6节:详细介绍GPT-4的局限性
  • 第7节:风险和因对方法
  • 第8节:结论
  • 参考文献
  • 附录23-98页

4.本文的内容涉及范围

  • 不会给出具体的技术细节,包括模型结构,模型大小,硬件,训练成本,数据集,训练方法。
  • 会给出一些初始的步骤和想法。

5.GPT-4的能力,实验

对于这部分实验,OpenAI在github上开源了评估框架。

模拟人类的考试

值得注意的是,这些考试的问题在模型训练的时候只会看到一部分相关的资料(例如律师考试不会有真题,但可能在训练集中有些相关法律书籍),这部分的实验展开的细节放在了附录C。这些测试的真题都来源于公开的available的材料。题目包括选择题和论述题,OpenAI对于这两种题目分别设计了prompt,这些prompt包括图片。最后这个实验考试的打分方式和人类的考试一样。这部分的实验的细节放在了附录A。

下表是实验结果,第一列是考试名称,包括律师考试、研究生入学考试、生物、化学、计算机。第2列是GPT-4(带vision输入的)、GPT-4(不带vision输入的)、GPT-3.5(应该不是ChatGPT,而是基础GPT-3.5)。分别给出了分数(例如298/400,分别是得分/总分)和排名(例如~90th,100个人超过了90%的人)。
在这里插入图片描述
下图给出了图示化展示,可以清晰看出GPT-4较不带vision和baseline的GPT3.5的差距。其中横坐标是考试名称,纵坐标是得分占总分的比。蓝色上方的绿色表示GPT-4(不带vision模块)超过GPT3.5的性能部分。如果绿色上方有深绿色,则表示GPT-4(带vision模块)超过GPT-4(不带vision模块)的性能部分。如果蓝色上方无其他(例如最后一列),则表示3者无差异。
在这里插入图片描述

传统的NLP任务

为了让GPT-4能理解实验问题什么的,OpenAI进行了适当的预处理,包括“问题翻译”和给出few-shot(细节见附录F)。
实验结果如下,第一列是案例(例如MMLU是在57个学术和专业性学科的多项选择题)。最后两列是最先进的模型(有特定任务上的微调)。
在这里插入图片描述

下图给出了不同语音对GPT-4性能的影响。

在这里插入图片描述
下图给出了GPT-4图片输入时的例子。

看了下回答,没什么问题,感觉理解了图片内容,并结合了LM中的常识,具备了一定的认知水平,很强!

在这里插入图片描述

5.GPT-4的局限性

未完待续。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18906.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 科幻中有机器人三原则,IBM说不够,要十六原则。 最新大模型研究工作中,以十六原则为基础,IBM让AI自己完成对齐流程。 全程只需300行(或更少)人类标注数据&#xff0…

git获取ssh密钥

桌面右击,选择 “Git Bash” 切换到 .ssh 路径下,如果不存在,则直接创建一个(本人在家目录即用户目录下) 添加用户名和密码 使用下面的命令创建ssh密钥 ssh-keygen一路回车即可 此时.ssh文件夹下便会包含两个文件&…

作为一名开发工程师,我对 ChatGPT 的一些看法

ChatGPT 又又火了。 ChatGPT 第一次爆火是2022年12月的时候,我从一些球友的讨论中知道了这个 AI 程序。 今年2月,ChatGPT 的热火更加猛烈,这时我才意识到,原来上次的热火只是我们互联网圈子内部火了,这次是真真正正的破圈了,为大众所熟悉了。 这个 AI 程序是一个智能问…

新版Web of science 如何导出全记录与引用的参考文献到Hisecite

Question: 我导开“查”文献科研培训会的时候提到Hisecite文献引用分析软件,在看录频的时候顺便了解这个软件,遇到了一个问题:目前网上关于hisecite的参考资料很多都是关于旧版WOS(Web of Science),本人经过翻阅资料&…

利用Web of Science进行文献检索

官网链接 Web of Science 1 基本检索 若要执行文献检索,可选择要检索的字段,然后在检索字段中输入检索词 可以通过主题|摘要|标题|作者|出版物名称|出版年等进行检索 注意:一般默认是主题(其中包括标题、摘要和索引&#xff09…

如何检索外文文献

目录 一、知网就能搞定的外文文献 1、检索 2、下载 二、知网中查不到或者下载不了的外文文献 一般,我们要查找中文文献很方便,知网就能下载,但是对于一些外文文献(最常见就是英文),如果知网里面找不到或…

如何搜索得到综述文献?

我们应该要怎样才能了解到这个研究方向究竟有什么成果,现如今的研究现状如何呢?这就需要我们对综述文献进行研读了。可是综述文献并不是随便可以找得到的,那我们要怎么样才能搜索到综述文献呢? 今天我从以下几点和大家分享&#…

如何进行文献检索?

文献检索可以看作是贯穿于论文写作全过程的一种“术”,当你学会文献检索的实践操作后,一定程度上你的互联网搜索能力也会有所提升,这种能给你带来双重作用的工具,还不赶紧来学会它! 文献检索主要包括5个步骤&#xff1…

Python编程基础

前言 前面基础知识部分的知识点较为杂乱,后面有总结好的知识点和例题,可以直接在目录里跳转。如果忘记了可以再跳转回去看详解的知识点。还有一些看起来不大聪明的问题,都是博主在学习过程中的疑问,如果知道的话可以直接跳过。 对…

Android自定义控件 - 彩虹表盘

说实话写代码久了,本能的会避免一些不熟悉的领域,而去做一些擅长的领域,这样使工作显得得心应手,但殊不知这是一种逃避行为,只有不断的面临问题甚至主动制造问题,好比说我偏偏不用setVisible这种老旧的显影…

半个月时间把MySQL重新巩固了一遍,梳理了一篇几万字 “超硬核” 文章!

MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一 MySQL实战文章目录 MySQL必会知识点梳理 (必看)【介绍】什么是数据库MySQL数据库RDBMS 术语数据库…

为什么只有涨价才能救小米?

作者:仙人JUMP 来源:https://www.xttblog.com/?p4777 01 小米10发布了,虽然各项参数都已经早就被剧透完了,那个充电器淘宝各路品牌都卖了大半年了,不过价格还是香的。 产品本身没什么惊喜,吊打友商几个月前…

不一样的母爱

文/爱笑的王阿哥(ISmileLi) 每个人都有自己的母亲 每位母亲都爱自己的孩子 我们也爱自己的母亲 但却和母亲爱我们不一样 我们对母亲的爱 像小桥流水 母亲对我们的爱 像江河湖海 每位母亲不同 表达爱的方式也不同 她们的爱 或平静 或深沉 或直白 每位母亲不同 表达爱的思想…

想要艺术气质高逼格,不吹牛真的有捷径可走

文中呈现出的经典西方作品,足以让你大脑空缺的西方美术史部分得以补充,想要艺术气质高逼格,读完是关键,你懂得! 达芬奇蒙娜丽莎 达芬奇的《蒙娜丽莎》成功地塑造了资本主义上升时期一位城市有产阶级妇女形象。据记载…

【码歌】代码歌颂人生----怎样给Swagger换皮肤?

上文我们讲到在Spring Boot中集成Swagger2的组件,那今天我们就来聊聊怎样给Swagger换个皮肤呢?环境搭建:使用Spring Boot依赖swagger-spring-boot-starter进行快速构建。具体swagger-spring-boot-starter可以参考:https://github.…

Spring中的Aop简单实例讲解

注重版权,转载请注明原作者和原文链接 作者:码农BookSea 原文链接:https://editor.csdn.net/md?articleId107092569 Aop,即面向切面编程,面向切面编程的目标就是分离关注点 比如:一个骑士只需要关注守护…

七夕我们在歌颂什么

“七夕节”是我国最具有浪漫色彩的节日,也是古代少女、闺妇最看重的节日。因主要的参与者是少女,活动以乞巧为主,也被称为“乞巧节”或“少女节”、“女儿节”。 农历七月初七,正值夏秋,晴朗夜空,明亮的牵牛…

细微之处见真章之JSON格式美化

一、背景 今天 段段 在技术群里提出一个问题:”如何实现JSON的格式美化“。 具体含义是,通过后端代码实现将紧凑的JSON字符串变为更美观的形式。 如下面的JSON字符串 {\"age\":0,\"name\":\"张三\",\"sex\":…

应对互联网变局,这 8 件事必须要做。

阅读本文大概需要 1.8 分钟。 昨晚直播说了挺多,整体都是跟互联网相关,也提到整体环境,有不少人失去工作后不知所措,也有不少人说创业的合规成本太高应该怎么做?更有不少在职场的人表示大家太卷又该怎么应对等等。 上述…

我让ChatGPT用CSS3画一个皮卡丘,还是自己画的可爱

突然想到了小时候看过的动画片《皮卡丘》,于是突然就想,ChatGPT肯定也看过,他哪有不知道的东西啊,于是就想着让他帮我画一个,他画出来之后,我笑了,这啥玩意儿啊。 目录 一、第一次尝试让ChatGP…