Re78 读论文：GPT-4 Technical Report

Re78 读论文：GPT-4 Technical Report

news/2025/4/1 9:28:12/文章来源:https://blog.csdn.net/PolarisRisingWar/article/details/145156390

诸神缄默不语-个人CSDN博文目录
诸神缄默不语的论文阅读笔记和分类

论文全名：GPT-4 Technical Report

官方博客：GPT-4 | OpenAI

appendix懒得看了。

文章目录

1. 模型训练过程心得
2. scaling law
3. 实验结果
- 减少风险

1. 模型训练过程心得

模型结构还是Transformers，训练目标还是语言模型（预测下一个token），我写过GPT-1/2/3的博文了直接看之前的博文吧。

增加了后训练对齐过程/用Reinforcement Learning from Human Feedback (RLHF)微调，提升模型回答的真实性，使其更符合人类偏好。

训练过程验证了scaling law，也就是有效的架构和优化方案在小模型上跑过之后，它们在大尺度模型上的效果提升是可预期的，这样只需在小模型上验证方案，就可以在大模型上放心去做了。

GPT-4仍然具有如下缺点（这也是现在很多大模型工作在致力于干掉的）：幻觉，上下文长度限制，训练后就无法更新知识（does not learn from experience），偏见

GPT-4模型可以根据用户偏好实现一定程度的定制化。

针对风险的解决方案：

safety-relevant RLHF training prompts
rule-based reward models (RBRMs)：若干GPT-4零样本分类器，输入是prompt、模型回复和人工评估的标准，输出是这个问答对是否安全

更多安全问题可以看System Card。

2. scaling law

损失函数与计算量遵循幂函数，高度可预测
指标也是
但也有例外：

3. 实验结果

对于数据污染情况，又做了一个把测试集中泄露数据去掉的新数据集，报告两个测试集上比较差的结果。

考试：
在这里插入图片描述

在这里插入图片描述

标准LM benchmark：
在这里插入图片描述

在用户偏好方面，相比GPT-3.5，人工标注者对GPT-4的回答打分更高。

GPT-4的跨语言能力：
在这里插入图片描述

多模态示例：
在这里插入图片描述

遵从事实的能力得到了提升：
在这里插入图片描述

在这里插入图片描述

上图任务所用的数据示例：
在这里插入图片描述

后训练（PPO）影响calibration（评估模型对可能性高的答案给出更高的置信度的能力）：
在这里插入图片描述

减少风险

找了专家来进行对抗式提问

示例：
在这里插入图片描述

在这里插入图片描述

改进误杀的示例：
在这里插入图片描述

安全性提升效果：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/3249.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Linux中安装mysql8，很详细

Linux中安装mysql8，很详细

一、查看系统glibc版本号，下载对应版本的MySQL 1、查看glibc版本号办法方法一：使用ldd命令在终端中输入ldd --version命令，然后按下回车键。这个命令会显示系统中安装的glibc版本号。例如，如果输出信息是ldd (GNU libc) 2.31&a…

阅读更多...

springboot如何解析 Map 的泛型信息来确定要注入哪些 Bean?

springboot如何解析 Map 的泛型信息来确定要注入哪些 Bean?

我在学习策略模式的时候, 发现当SpringBoot注入一个Map的时候 ，value泛型为T，则注入后Spring会将实例化后的bean放入value ，key则为注入后bean的名字 Springboot如何解析Map中的Value Spring 通过解析 Map 的泛型信息来确定要注入哪些 Bean…

阅读更多...

【NextJS】PostgreSQL 遇上 Prisma ORM

【NextJS】PostgreSQL 遇上 Prisma ORM

NextJS 数据库之遇上Prisma ORM 前言一、环境要求二、概念介绍1、Prisma Schema Language（PSL） 结构描述语言1.1 概念1.2 组成1.2.1 Data Source 数据源1.2.2 Generators 生成器1.2.3 Data Model Definition 数据模型定义字段(数据)类型和约束关系&…

阅读更多...

一些常见的Java面试题及其答案

一些常见的Java面试题及其答案

Java基础 1. Java中的基本数据类型有哪些？ 答案：Java中的基本数据类型包括整数类型（byte、short、int、long）、浮点类型（float、double）、字符类型（char）和布尔类型（boo…

阅读更多...

Vue2+OpenLayers实现折线绘制功能（提供Gitee源码）

Vue2+OpenLayers实现折线绘制功能（提供Gitee源码）

目录一、案例截图二、安装OpenLayers库三、代码实现 3.1、初始变量 3.2、画一条折线 3.3、完整代码四、Gitee源码一、案例截图二、安装OpenLayers库 npm install ol 三、代码实现 3.1、初始变量关键代码： data() {return {map:null,// 定义路径坐…

阅读更多...

【狂热算法篇】探秘图论之 Floyd 算法：解锁最短路径的神秘密码(通俗易懂版)

【狂热算法篇】探秘图论之 Floyd 算法：解锁最短路径的神秘密码(通俗易懂版)

： 羑悻的小杀马特.-CSDN博客羑悻的小杀马特.擅长C/C题海汇总,AI学习,c的不归之路,等方面的知识,羑悻的小杀马特.关注算法,c,c语言,青少年编程领域.https://blog.csdn.net/2401_82648291?spm1010.2135.3001.5343 在本篇文章中，博主将带大家去学习所谓的…

阅读更多...

【服务治理中间件】consul介绍和基本原理

【服务治理中间件】consul介绍和基本原理

目录一、CAP定理二、服务注册中心产品比较三、Consul概述 3.1 什么是Consul 3.2 Consul架构 3.3 Consul的使用场景 3.4 Consul健康检查四、部署consul集群 4.1 服务器部署规划 4.2 下载解压 4.3 启动consul 五、服务注册到consul 一、CAP定理 CAP定理&#xff…

阅读更多...

Linux命令行工具-使用方法

Linux命令行工具-使用方法

参考资料 Linux网络命令：网络工具socat详解-CSDN博客 arm-linux-gnueabihf、aarch64-linux-gnu等ARM交叉编译GCC的区别_aarch64-elf-gcc aarch64-linux-gnu-CSDN博客解决Linux内核问题实用技巧之-dev/mem的新玩法-腾讯云开发者社区-腾讯云热爱学习地派大星-CS…

阅读更多...

5-1 创建和打包AXI Interface IP

5-1 创建和打包AXI Interface IP

创建和打包AXI Interface IP的前流程和后流程 step 1 ： 选择类型 1： 将当前的工程打包成IP 2： 将当前的BD工程打包成IP 3： 将指定的源码打包成IP 4： 创建一个新的AXI 接口IP 其中3和4是比较常用的，本次…

阅读更多...

贪心算法（题1）区间选点

贪心算法（题1）区间选点

输出 2 #include <iostream> #include<algorithm>using namespace std;const int N 100010 ;int n; struct Range {int l,r;bool operator <(const Range &W)const{return r<W.r;} }range[N];int main() {scanf("%d",&n);for(int i0;i&l…

阅读更多...

攻防世界 unseping

攻防世界 unseping

开启场景整体来说是创建了一个case类，然后可接受post传来的ctf的值，并对其进行base64解码以及反序列化。所以我们能控制ctf变量。先看__wakeup方法，该方法使用waf方法对$arg中的内容进行了防护，过滤掉了| & ; 空格 / cat f…

阅读更多...

光伏储能电解水制氢仿真模型Matlab/Simulink

光伏储能电解水制氢仿真模型Matlab/Simulink

今天更新的内容为光伏储能制氢技术，这个方向我之前在21年就系统研究并发表过相关文章，经过这几年的发展，绿色制氢技术也受到更多高校的注意，本篇博客也是在原先文章的基础上进行更新。首先让大家熟悉一下绿氢制取技术这个概念&a…

阅读更多...

java spring，uName，kValue，前端传值后端接不到

java spring，uName，kValue，前端传值后端接不到

大神链接https://blog.csdn.net/qq_39327650/article/details/134419523本文是参考上述大神链接，自己写这个博客主要是给自己加深印象，大神链接里描述的很清晰，包括源码解析，详细描述参考大神。由于springboot用的是jackson进行…

阅读更多...

XML序列化和反序列化的学习

XML序列化和反序列化的学习

1、基本介绍在工作中，经常为了调通上游接口，从而对请求第三方的参数进行XML序列化，这里常使用的方式就是使用JAVA扩展包中的相关注解和类来实现xml的序列化和反序列化。 2、自定义工具类 import javax.xml.bind.JAXBContext; import javax.x…

阅读更多...

【时时三省】(C语言基础）柔性数组的使用

【时时三省】(C语言基础）柔性数组的使用

山不在高，有仙则名。水不在深，有龙则灵。 ----CSDN 时时三省示例： 柔性数组是一次性开辟的一块空间，实际上后面arr的空间是通过预设的方式，给它增加了一块空间用柔性数组得好处第一个好处是：方便内存…

阅读更多...

RAG 切块Chunk技术总结与自定义分块实现思路

RAG 切块Chunk技术总结与自定义分块实现思路

TrustRAG项目地址🌟：https://github.com/gomate-community/TrustRAG 可配置的模块化RAG框架切块简介在RAG（Retrieval-Augmented Generation）任务中，Chunk切分是一个关键步骤，尤其是在处理结构复杂的PDF文…

阅读更多...

【MySQL】数据库约束和多表查询

【MySQL】数据库约束和多表查询

目录 1.前言 2.数据库约束 2.1约束类型 2.2?NULL约束 2.3 NUIQUE：唯一约束 2.4?DEFAULT：默认值约束 2.5?PRIMARY KEY：主键约束 2.6 FOREIGN KEY：外键约束 1.7?CHECK约束 3.表的设计? 3.1一对一 3.2一对多 3.3多…

阅读更多...

解锁C#语法的无限可能：从基础到进阶的编程之旅

解锁C#语法的无限可能：从基础到进阶的编程之旅

目录一、C# 基础语法 1.1 数据类型 1.2 变量与常量 1.3 运算符 1.4 控制流语句二、C# 面向对象编程语法 2.1 类与对象 2.2 封装 2.3 继承 2.4 多态虚方法抽象类接口三、C# 高级语法 3.1 特性（Attribute） 预定义特性自定义特性 3…

阅读更多...

【2024年华为OD机试】 (C卷,100分)- 小明找位置（Java JS PythonC/C++）

【2024年华为OD机试】 (C卷,100分)- 小明找位置（Java JS PythonC/C++）

一、问题描述题目描述小朋友出操，按学号从小到大排成一列； 小明来迟了，请你给小明出个主意，让他尽快找到他应该排的位置。算法复杂度要求不高于nLog(n)；学号为整数类型，队列规模 ≤ 10000&#xff1…

阅读更多...

vue2配置跨域后请求的是本机

vue2配置跨域后请求的是本机

这个我来说明一下，因为我们公司的后端设置解决了跨域问题，所以我有很久没有看相关的内容了，然后昨天请求了需要跨域的接口，请求半天一直不对，浏览器显示的是本机地址，我以为是自己配置错了，后面…

阅读更多...

最新文章

推荐文章