在LLMs模型中发现人类的记忆特征

论文地址:https://arxiv.org/abs/2311.03839
介绍

大型语言模型(LLM),如 ChatGPT,为语言建模和生成人类水平的文本输出带来了质的飞跃。

这些模型在庞大的文本库中进行训练,有效地建立了高度复杂和准确的语言概率模型。

另一方面,使用这些语言是智人最重要的特征之一,了解人类认知能力与这些语言特征之间的相互关系一直被认为是一个非常重要的研究领域。

再加上在现有的研究中,LLMs 表现出了与人类相似的记忆特征,因此本文作者认为 “LLMs 可以作为一个非常有用的工具,用于这方面的研究”。

在此背景下,本文介绍了为研究人类记忆特征与 LLM 之间的相似性而进行的各种实验,并证明了人类特有的现象,如先验效应、致死效应和通过重复巩固记忆等,也出现在 LLM 中

概述

虽然人类的记忆看似简单,但实际上具有非常特殊的性质,许多认知心理学家对其进行了长达一个多世纪的研究。

这些记忆特性的典型表现是首要效应和复现效应,即在记忆单词表时,位于单词表开头或结尾的单词更容易被回忆起来。

此外,还发现了人类特有的其他各种记忆特征,例如,记忆会在一定时间间隔内通过重复而得到加强。

本文论证了 LLMs 可以成为研究这种人类特有记忆特征的非常有用的工具,并利用 LLMs 实际进行了各种实验。

实验装置

认知心理学中的标准记忆测试技术包括给参与者提供一份按顺序排列的单词表,要求他们记住自己在单词表中的位置,然后测试他们回忆的准确性。

另一方面,这些方法很难适用于 LLM,因此本文转而设计了一种文本结构来探索特定的记忆特征。

实验过程如下图所示。(本文所有实验均使用开源模型 GPT-J)。

在这个实验中,GPT-J 不是记忆单词列表,而是向其展示有关任何姓名标识的人的事实列表。

然后在 GPT-J 中添加以下查询

如果输出概率最高的名词与事实列表中给特定人(此处为保罗)的名词相匹配,那么答案就被认为是正确的。

本文通过改变需要记忆的事实列表的长度、类别和插入文字,进行了各种实验,并对出现的记忆特征进行了研究。

实验结果

首要效应、重复效应

为了研究上述优先效应和致死效应是否会出现在 LLM 中,我们将特定 X 在事实列表中的位置作为函数来计算召回准确率。

下图显示了人类和 GPT-J 记忆实验对 20 个事实列表的回忆准确率。

该图中的 U 型曲线是主要效应和致死效应的特有现象,结果证实了主要效应和致死效应在LLM 中的出现与在人类中一样。

其他信息

在人类记忆测试中发现的另一个特点是,插入有关某个单词的附加信息会提高回忆起该单词的可能性,即使查询不包含附加信息。

为了检验本文中的 LLM 是否也出现了类似的现象,我们在列表的某些位置(第 5、10 和 15 位)插入了以下附加信息。

下图显示了基线与插入附加信息后 GPT-J 召回准确率的比较。

该图清楚地表明,插入附加信息可提高召回准确率。

通过重复强化记忆

很明显,通过重复可以加深对给定材料的记忆,在这方面,法律硕士也可能有类似的表现。

就人类记忆而言,心理学家艾宾浩斯(Ebbinghaus)指出,“在最初记忆要学习的材料(=艾宾浩斯的遗忘曲线)后有一定的时间间隔时,记忆效果最好”。

具体做法是,在上述提供给 GPT-J 的事实清单文本之前插入一个重复句(=要记忆的事实清单),这样要记忆的信息就会在文本中重复出现。

与正常基线的对比实验结果如下图所示。

如图所示,LLM(=repeated),即需要记忆的信息在文本中重复出现,与基线相比,记忆准确率有显著提高。

此外,还发现了一种与人类记忆特征相一致的趋势,即当重复信息的文字与事实列表中的文字距离较远(=分离)时,记忆的准确性就会提高。

总结

结果如何?在这篇文章中,我们介绍了一篇论文,该论文通过各种实验研究了人类记忆特征与 LLM 之间的相似性,并证明了人类特有的现象,如先验效应、致死效应和通过重复巩固记忆也出现在 LLM中。

本文的实验结果证实了人类和 LLMs 记忆特征之间的许多相似之处,这些结果表明 LLMs 是研究人类生物记忆机制的一种非常有用的工具。

关于这个实验的结果,作者 “认为 LLM 的类人记忆特性并不是从 LLM 架构中自动衍生出来的,而是从训练文本数据的统计中学习出来的”,因此我们期待未来有更多的研究来证实这一假设!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/434050.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

标准 I/O

标准 I/O 引言 I/O 是一切实现的基础,其分为标准 I/O 和文件 I/O。 文件 I/O 依赖操作系统,因系统的实现方式而定,对于程序员来说会造成很大困扰。如打开文件,Linux 系统调用为 open() 函数,而 Windows 的系统调用为…

【锁住精华】MySQL锁机制全攻略:从行锁到表锁,共享锁到排他锁,悲观锁到乐观锁

MySQL有哪些锁 1、按照锁的粒度划分 行锁 是最低粒度的的锁,锁住指定行的数据,加锁的开销较大,加锁较慢,可能会出现死锁的情况,锁的竞争度会较低,并发度相对较高。但是如果where条件里的字段没有加索引&…

OpenCV 形态学相关函数详解及用法示例

OpenCV形态学相关的运算包含腐蚀(MORPH_ERODE),膨胀(MORPH_DILATE),开运算(MORPH_OPEN),闭运算(MORPH_CLOSE),梯度运算(MORPH_GRADIENT),顶帽运算(MORPH_TOPHAT),黑帽运算(MORPH_BLACKHAT),击中…

AI产品经理:基于大模型Agent的客服实践,更低的成本与更大的收益

现在AI客服已经在各行业普遍使用了,但是实际效果并不如意——用户宁愿等人工客服,也不愿意找AI客服解决问题。如果给当前的AI客服换成大模型,效果会不会更好一些?这篇文章,我们来看看作者的思考。 一、为什么要用大模型…

Python 从入门到实战30(高级文件的操作)

我们的目标是:通过这一套资料学习下来,通过熟练掌握python基础,然后结合经典实例、实践相结合,使我们完全掌握python,并做到独立完成项目开发的能力。 上篇文章我们讨论了操作目录的相关知识。今天我们将学习一下高级文…

一文学会 Java 8 的Predicates

​ 博客主页: 南来_北往 系列专栏:Spring Boot实战 前言 在这份详细的指南中,您将了解 Java Predicates,这是 Java 8 中一个新颖且有用的特性。本文解释了 Java Predicates 是什么以及如何在各种情况下使用它们。 在这份详尽的指南中…

游戏开发2025年最新版——八股文面试题(unity,虚幻,cocos都适用)

1.静态合批与动态合批的原理是什么?有什么限制条件?为什么?对CPU和GPU产生的影响分别是什么? 原理:Unity运行时可以将一些物体进行合并,从而用一个描绘调用来渲染他们,就是一个drawcall批次。 限…

信安 实验1 用Wireshark分析典型TCP/IP体系中的协议

我发现了有些人喜欢静静看博客不聊天呐, 但是ta会点赞。 这样的人呢帅气低调有内涵, 美丽大方很优雅。 说的就是你, 不用再怀疑哦 实验1 用Wireshark分析典型TCP/IP体系中的协议 实验目的 通过Wireshark软件分析典型网络协议数据包&a…

javaweb 实验3

我发现了有些人喜欢静静看博客不聊天呐, 但是ta会点赞。 这样的人呢帅气低调有内涵, 美丽大方很优雅。 说的就是你, 不用再怀疑哦 实验三 Web基础-JavaScript 目的: 1、 理解和掌握Javascript基本语法 2、 掌握JavaScr…

html+css+js实现Pagination 分页

效果图 HTML部分 <body><div class"pagination"><button class"prev"><</button><ul><li class"active">1</li><li>2</li><li>3</li><li>4</li><li>5…

敏捷开发与DevOps的有机结合

在当今快速变化的技术环境中&#xff0c;软件开发团队面临着前所未有的挑战。客户需求不断变化&#xff0c;市场竞争激烈&#xff0c;技术更新速度加快&#xff0c;这些因素都要求开发团队具备高度的敏捷性和高效的运营能力。为了应对这些挑战&#xff0c;越来越多的企业选择将…

024.PL-SQL进阶—游标

课 程 推 荐我 的 个 人 主 页&#xff1a;&#x1f449;&#x1f449; 失心疯的个人主页 &#x1f448;&#x1f448;入 门 教 程 推 荐 &#xff1a;&#x1f449;&#x1f449; Python零基础入门教程合集 &#x1f448;&#x1f448;虚 拟 环 境 搭 建 &#xff1a;&#x1…

JAVA红娘婚恋相亲交友系统源码全面解析

在数字化时代&#xff0c;红娘婚恋相亲交友系统成为了连接单身男女的重要桥梁。JAVA作为一种流行的编程语言&#xff0c;为开发这样的系统提供了强大的支持。编辑h17711347205以下是对JAVA红娘婚恋相亲交友系统源码的全面解析&#xff0c;以及三段示例代码的展示。 系统概述 …

【Gitee自动化测试4】本地Git分支的增删查,本地Git分支中文件的增删查,本地文件的暂存/提交,本地分支的推送

一、流程 本地创建分支&#xff0c;设定连接什么云分支本地创建文件&#xff0c;暂存、提交–>本地分支本地分支推送所有修改–>云仓库 二、分支概念 在版本回退里&#xff0c;每次提交&#xff0c;git都把它们串成一条时间线&#xff0c;这条时间线可以理解为是一个分…

Verilog基础:时序调度中的竞争(四)(描述时序逻辑时使用非阻塞赋值)

相关阅读 Verilog基础https://blog.csdn.net/weixin_45791458/category_12263729.html?spm1001.2014.3001.5482 作为一个硬件描述语言&#xff0c;Verilog HDL常常需要使用语句描述并行执行的电路&#xff0c;但其实在仿真器的底层&#xff0c;这些并行执行的语句是有先后顺序…

论文阅读:LM-Cocktail: Resilient Tuning of Language Models via Model Merging

论文链接 代码链接 Abstract 预训练的语言模型不断进行微调&#xff0c;以更好地支持下游应用。然而&#xff0c;此操作可能会导致目标领域之外的通用任务的性能显著下降。为了克服这个问题&#xff0c;我们提出了LM Cocktail&#xff0c;它使微调后的模型在总体上保持弹性。…

文章解读与仿真程序复现思路——中国电机工程学报EI\CSCD\北大核心《考虑异步区域调频资源互济的电能、惯性与一次调频联合优化出清模型》

本专栏栏目提供文章与程序复现思路&#xff0c;具体已有的论文与论文源程序可翻阅本博主免费的专栏栏目《论文与完整程序》 论文与完整源程序_电网论文源程序的博客-CSDN博客https://blog.csdn.net/liang674027206/category_12531414.html 电网论文源程序-CSDN博客电网论文源…

Spring Boot助力:小徐影院管理系统

第二章开发技术介绍 2.1相关技术 小徐影城管理系统是在Java MySQL开发环境的基础上开发的。Java是一种服务器端脚本语言&#xff0c;易于学习&#xff0c;实用且面向用户。全球超过35&#xff05;的Java驱动的互联网站点使用Java。MySQL是一个数据库管理系统&#xff0c;因为它…

python学习第十二节:python开发图形界面

python学习第十二节&#xff1a;python开发图形界面 创建一个窗口实例化窗口对象调用窗口设置窗口大小设置窗口的标题设置窗口图标否能够改变窗口设置窗口的背景 创建容器组件容器组件的介绍组件参数的介绍label标签label添加标签控件 label添加标签定位label的relief参数label…

无人机之模拟图传篇

无人机的模拟图传技术是一种通过模拟信号传输图像数据的方式&#xff0c;它通常使用无线电模块或专用通信协议进行数据传输。 一、基本原理 模拟图传技术的工作原理是将摄像头或相机设备采集到的图像数据&#xff0c;通过模拟信号的形式进行传输。这些模拟信号在传输过程中可能…