GPT-4-Turbo的128K长度上下文性能如何？超过73K Tokens的数据支持依然不太好！

GPT-4-Turbo的128K长度上下文性能如何？超过73K Tokens的数据支持依然不太好！

news/2024/12/26 21:04:59/文章来源:https://blog.csdn.net/df19900725/article/details/134321739

本文原文来自DataLearnerAI官方网站：GPT-4-Turbo的128K长度上下文性能如何？超过73K Tokens的数据支持依然不太好！ | 数据学习者官方网站(Datalearner)https://www.datalearner.com/blog/1051699526438975

GPT-4 Turbo是OpenAI最新发布的号称性能超过当前GPT-4的模型。在新版本的ChatGPT中已经可以使用。而接口也在开放。除了速度和质量外，GPT-4 Turbo最吸引人的是支持128K超长上下文输入。但是，实际测试中GPT-4 Turbo对于超过73K tokens文档的理解能力急速下降。

GPT-4 Turbo支持128K的效果不完美

GPT-4 Turbo简介
如何测试GPT-4对超长上下文理解能力的水平？
GPT-4 Turbo对128超长上下文支持的实际结果

GPT-4 Turbo对128超长上下文支持的实际结果

作者做了一张图描述这个结果：

GPT-4 Turbo 128K超长上下文测试

图的横坐标是文档的长度，纵坐标是插入的文本在文档的位置。可以看到，在右上角区域模型表现效果很差，这些基本都是文档上半段，然后开始位置之后（7%位置之后）。但是如果这句话在文档下半段效果反而还可以。

最终的实验结论如下：

GPT-4的召回率在输入文档超过73K tokens之后下降明显，这意味着，如果你的文档超过了50万单词之后可能GPT-4并不能准确找到你问题的答案位置；
如果你的答案恰巧在文档7%-50%的位置，那么GPT-4能找到的概率最低，而50%的位置正好是文档中间。这也侧面验证了此前大模型的Lost in Middles特点（具体参考：大模型如何使用长上下文信息？斯坦福大学最新论文证明，你需要将重要的信息放在输入的开始或者结尾处！）
如果需要回忆的事实位于文档的开头，无论上下文长度如何，都能被回忆起。这可能意味着模型对文档开头的信息有更好的记忆能力。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/187350.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

海康Visionmaster-通讯管理：使用 Modbus TCP 通讯协议与流程交互

海康Visionmaster-通讯管理：使用 Modbus TCP 通讯协议与流程交互

使用 Modbus TCP 通讯协议与视觉通讯，当地址为 0000 的保持型寄存器(4x 寄存器)变为 1 时，触发视觉流程执行一次，同时视觉将地址为 0000 的寄存器复位（也即写为 0），视觉流程执行完成后，将结果数…

阅读更多...

RPC 框架 openfeign 介绍和学习使用总结

RPC 框架 openfeign 介绍和学习使用总结

一、基本概念 RPC 远程过程调用（Remote Procedure Call）的缩写形式 Birrell 和 Nelson 在 1984 发表于 ACM Transactions on Computer Systems 的论文《Implementing remote procedure calls》对 RPC 做了经典的诠释。 RPC 是指计算机 A 上的进程&am…

阅读更多...

Ps：选区的基本操作

Ps：选区的基本操作

在 Photoshop 中，选区是为处理局部图像而自行定义的一个区域。定义选区后，操作被限制在选区之内。选区周围显示的虚线边框，俗称“蚂蚁线”。全选 Select All Ps菜单：选择/全部 Select/All 快捷键：Ctrl A 提示&#…

阅读更多...

虚幻C++基础 day3

虚幻C++基础 day3

常见的游戏机制 Actor机关门创建一个Actor类，添加两个静态网格与一个触发器 UBoxComponentUStaticMeshComponent 头文件： #include “Components/BoxComponent.h”#include “Components/StaticMeshComponent.h” TriggerDoor.h // Fill out your …

阅读更多...

SPI简介及FPGA通用MOSI模块实现

SPI简介及FPGA通用MOSI模块实现

简介 SPI（Serial Peripheral Interface，串行外围设备接口）通讯协议，是Motorola公司提出的一种同步串行接口技术。是一种高速、全双工、同步通信总线。在芯片中只占用四根管脚用来控制及数据传输。优缺点： SPI通讯协…

阅读更多...

yolov5 利用Labelimg对图片进行标注

yolov5 利用Labelimg对图片进行标注

首先打开yolov5-master，在data文件中新建一个文件夹来存放你需要跑的数据，例如我这次跑的是羽毛球，文件把文件取名为badminton。使用其他文件夹例如images也可以，就是跑多了以后不好整理，然后点击选中刚刚你存放数据的…

阅读更多...

iOS应用加固方案解析：ipa加固安全技术全面评测

iOS应用加固方案解析：ipa加固安全技术全面评测

在移动应用开发领域，iOS应用的安全性一直备受关注。ipaguard作为一款专业的iOS应用加固方案，采用混淆加密技术，旨在保护应用免受破解、逆向和篡改等风险。本文将深入探讨ipaguard的产品功能、安全技术及其在iOS应用加固领域中的核心优势和…

阅读更多...

从零开始搭建React+TypeScript+webpack开发环境-基于lerna的webpack项目工程化改造

从零开始搭建React+TypeScript+webpack开发环境-基于lerna的webpack项目工程化改造

项目背景在实际项目中，我们的前端项目往往是一个大型的Webpack项目，结构较为复杂。项目根目录下包含了各种配置文件、源代码、以及静态资源，整体布局相对扁平。Webpack的配置文件分散在不同的部分，包括入口文件、输出目录、加载…

阅读更多...

C#基于inpoutx64读写ECRAM硬件信息

C#基于inpoutx64读写ECRAM硬件信息

inpoutx64.dll分享路径： 链接：https://pan.baidu.com/s/1rOt0xtt9EcsrFQtf7S91ag 提取码：7om1 1.InpOutManager： using System; using System.Collections.Generic; using System.Linq; using System.Runtime.InteropServi…

阅读更多...

基于Docker容器DevOps应用方案

基于Docker容器DevOps应用方案

文章目录基于docker容器DevOps应用方案环境基础配置1.所有主机永久关闭防火墙和selinux2.配置yum源3.docker的安装教程配置主机名与IP地址解析部署gitlab.server主机1.安装gitlab2.配置gitlab3.破解管理员密码4.验证web页面部署jenkins.server主机1.部署tomcat2.安装jenkins…

阅读更多...

Ubuntu(WSL) mysql8.0.31 源码安装

Ubuntu(WSL) mysql8.0.31 源码安装

要在 Ubuntu 上使用调试功能安装 MySQL 8.0 的源码，可以按照以下详细步骤进行操作： 1. 更新系统首先，确保你的 Ubuntu 系统是最新的。运行以下命令更新系统软件包： sudo apt update sudo apt upgrade 2. 下载 MySQL 源码访…

阅读更多...

Wix使用velo添加Google ads tag并在form表单提交时向谷歌发送事件

Wix使用velo添加Google ads tag并在form表单提交时向谷歌发送事件

往head里加代码时，不能看谷歌的代码，要看wix的代码，不然必定踩坑 https://support.wix.com/en/article/tracking-google-ads-conversions-using-wix-custom-code 这里的代码才对，因为wix搞了个velo，这个velo很傻x&am…

阅读更多...

ChatGPT、GPT-4 Turbo接口调用

ChatGPT、GPT-4 Turbo接口调用

接口地址 https://chat.xutongbao.top/api/light/chat/createChatCompletion 请求方式 post 请求参数 model可选值： “gpt-3.5-turbo-1106”、 “gpt-3.5-turbo-16k” 、 “gpt-4”、“gpt-4-1106-preview”。默认值为： “gpt-3.5-turbo-1106” to…

阅读更多...

时间序列预测模型实战案例(十)(个人创新模型)通过堆叠CNN、GRU、LSTM实现多元预测和单元预测

时间序列预测模型实战案例(十)(个人创新模型)通过堆叠CNN、GRU、LSTM实现多元预测和单元预测

本文介绍本篇博客为大家讲解的是通过组堆叠CNN、GRU、LSTM个数，建立多元预测和单元预测的时间序列预测模型，其效果要比单用GRU、LSTM效果好的多，其结合了CNN的特征提取功能、GRU和LSTM用于处理数据中的时间依赖关系的功能。通过将它们组合在…

阅读更多...

基于GCC的工具objdump实现反汇编

基于GCC的工具objdump实现反汇编

一：objdump介绍在 Linux中，一切皆文件。 Linux 编程实际上是编写处理各种文件的代码。系统由许多类型的文件组成，但目标文件具有一种特殊的设计，提供了灵活和多样的用途。目标文件是包含带有附加地址和值的助记符号的路线图。这…

阅读更多...

PHP编写采集药品官方数据的程序

PHP编写采集药品官方数据的程序

在 PHP 中编写爬虫程序，首先我们需要引入一些必要的库，如 curl 和 file_get_contents。然后，我们需要设置爬虫ip信息，以便我们可以从指定的爬虫ip服务器上获取数据。 // 引入必要的库 require_once curl.php;// 设置爬虫ip信息 $p…

阅读更多...

招聘信息采集

招聘信息采集

首先，我们需要使用PHP的curl库来发送HTTP请求。以下是一个基本的示例： <?php // 初始化curl $ch curl_init();// 设置代理 curl_setopt($ch, CURLOPT_PROXY, "jshk.com.cn");// 设置URL curl_setopt($ch, CURLOPT_URL, "http://www…

阅读更多...

leetcode一道比较难的链表题

leetcode一道比较难的链表题

今天还是继续来分享我们的链表题，这个题目有点难，主要是思路比较难想，但是如果沥青思路写起来就比较简单了（我乱讲的） 随机链表的复制这个是题目的描述，大家也可以在链接里看，那我把这道题目…

阅读更多...

VNC连接服务器实现远程桌面 --以AutoDL云服务器为例

VNC连接服务器实现远程桌面 --以AutoDL云服务器为例

VNC连接服务器实现远程桌面 --以AutoDL云服务器为例针对本地机为Windows 云服务器租显卡跑些小模型很方便，但是当你想做可视化的时候，可能会遇到麻烦，云服务器没有显示输出界面，无法可视化一些检测任务的结果，或者可…

阅读更多...

chrome 的vue3的开发者devtool不起作用

chrome 的vue3的开发者devtool不起作用

问题： 刚刚vue2升级到vue3，旧的devtool识别不了vue3数据。原因： devtool版本过低。升级到最新。解决： 去github下载vuetool项目代码： GitHub - vuejs/devtools: ⚙️ Browser devtools extension for debugging…

阅读更多...

最新文章

推荐文章