论文阅读：Editing Large Language Models: Problems, Methods, and Opportunities

论文阅读：Editing Large Language Models: Problems, Methods, and Opportunities

news/2024/12/24 1:11:06/文章来源:https://blog.csdn.net/huzimu_/article/details/136645123

Editing Large Language Models: Problems, Methods, and Opportunities

论文链接
代码链接

摘要

由于大语言模型（LLM）中可能存在一些过时的、不适当的和错误的信息，所以有必要纠正模型中的相关信息。如何高效地修改模型中的相关信息而不影响无关的信息，是模型编辑方法试图解决的问题。本篇文章对大语言模型上的模型编辑方法（model editing）进行了分类介绍和评估，并提出了一个新的基准，包括评估数据集和评估标准。
Model editing to fix and update LLMs

分类

LLM上的模型编辑方法主要包括两类：(a) 模型参数不变（Preserving LLMs’ Parameters)；(b) 模型参数改变(Preserving LLMs’ Parameters)。模型参数不变的方法又可以分为额外参数 (Additional Parameters) 和基于记忆的 (Memory-based Model)方法。而模型参数改变的方法又可以分为定位然后编辑类（Locate-Then-Edit）和元学习类（Meta-learning）。

Methods for Preserving LLMs’ Parameters

Memory-based Model 该类方法又两类分支，一种是借助一个在新的事实上训练的模型辅助预测，另一种是借助检索到的知识作为提示词的一部分信息。
Additional Parameters 该类方法引入额外的可训练参数，这些参数根据新的事实数据集训练，而模型的原始参数不变。

Methods for Modifying LLMs’ Parameters

Locate-Then-Edit 该类方法首先定位到特定知识相关的参数，然后直接进行修改（无需额外的训练和微调）。
Meta-learning 该类方法应用一个超网络学习更新模型参数的变量。
Overview

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/276882.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MySQL--深入理解MVCC机制原理

MySQL--深入理解MVCC机制原理

什么是MVCC？ MVCC全称 Multi-Version Concurrency Control，即多版本并发控制，维持一个数据的多个版本，主要是为了提升数据库的并发访问性能，用更高性能的方式去处理数据库读写冲突问题，实现无锁并发。什…

阅读更多...

Mac上使用M1或M2芯片的设备安装Node.js时遇到一些问题，比如卡顿或性能问题

Mac上使用M1或M2芯片的设备安装Node.js时遇到一些问题，比如卡顿或性能问题

对于Mac上使用M1或M2芯片的设备可能会遇到在安装Node.js时遇到一些问题，比如卡顿或性能问题。这可能是因为某些软件包或工具在M1或M2芯片上的兼容性不佳。为了解决这个问题，您可以尝试以下方法： 1. 使用Rosetta模式对于一些尚未适配M1或M2…

阅读更多...

AI智能分析网关V4将HTTP消息推送至安防监控视频汇聚EasyCVR平台的操作步骤

AI智能分析网关V4将HTTP消息推送至安防监控视频汇聚EasyCVR平台的操作步骤

TSINGSEE青犀视频智能分析网关V4内置了近40种AI算法模型，支持对接入的视频图像进行人、车、物、行为等实时检测分析，上报识别结果，并能进行语音告警播放。硬件管理平台支持RTSP、GB28181协议、以及厂家私有协议接入，可兼容市面上常…

阅读更多...

接口测试和功能测试有什么区别

接口测试和功能测试有什么区别

本文主要分为两个部分： 第一部分：主要从问题出发，引入接口测试的相关内容并与前端测试进行简单对比，总结两者之前的区别与联系。但该部分只交代了怎么做和如何做？并没有解释为什么要做？ 第二部分&#xff1…

阅读更多...

webpack5零基础入门-8清空前次打包文件与处理图标字体资源

webpack5零基础入门-8清空前次打包文件与处理图标字体资源

1.配置output中的clean属性为true output: {/**文件输出路径绝对路径*///__dirname 表示当前文件的文件夹目录path: path.resolve(__dirname, dist),//所有文件的输出目录/**文件名 */filename: static/js/dist.js,//入口文件输出文件名clean: true,//在打包前将path整个目录内…

阅读更多...

唯众物联网+地理科学交付云南师范大学地理学部教学实验室项目

唯众物联网+地理科学交付云南师范大学地理学部教学实验室项目

近日，云南师范大学地理学部教学实验室建设项目顺利交付。该项目的成功落地，标志着物联网技术与地理科学教育的深度融合，为云南师范大学的地理教学提供了全新的教学平台与资源。该项目以物联网技术为核心，结合地理科学的特点&#…

阅读更多...

绝地求生：PUBG 2024年更新重点偏向于武器平衡、游戏互动及联名道具

绝地求生：PUBG 2024年更新重点偏向于武器平衡、游戏互动及联名道具

一、游戏体验 1. 增加可破坏的环境 1.1 增加更多互动功能通过可破坏环境将游戏方式变得千变万化。待功能上线，在后续游戏中玩家可以对建筑物进行部分破坏来开辟新的进攻、撤退路线，或搭建掩体进行战略性攻击。环境破坏部分功能，将会在4…

阅读更多...

基于SWOT的智能手机企业财务战略研究1.62

基于SWOT的智能手机企业财务战略研究1.62

摘要近些年，网络技术日新月异，智能手机深受消费者喜爱，人们通过网络，手机应用，可以极大地方便人们学习，工作等等。由于国家对电信行业的大力支持，中国消费者群体逐步成为最具潜力的手机购买者…

阅读更多...

中国首个基于区块链的分布式算力网络上线

中国首个基于区块链的分布式算力网络上线

随着美国人工智能公司OpenAI近期发布的Sora视频模型，全球对高性能算力的需求突破了历史新高。Sora的创新在于它能够以超长生成时间、多角度镜头捕捉，理解物理世界的能力，这不仅是技术的一大突破，更是对算力需求的一大挑战。在这样…

阅读更多...

浅易理解：非极大抑制NMS

浅易理解：非极大抑制NMS

什么是非极大抑制NMS 非极大值抑制（Non-Maximum Suppression，简称NMS）是一种在计算机视觉和图像处理领域中广泛使用的后处理技术，特别是在目标检测任务中。它的主要目的是解决目标检测过程中出现的重复检测问题，即对于…

阅读更多...

《JAVA与模式》之简单工厂模式

《JAVA与模式》之简单工厂模式

系列文章目录文章目录系列文章目录前言一、简单工厂模式二、简单工厂模式的优缺点前言前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站，这篇文章男女通用，看懂了就去分享给你的码吧。在阎宏博士的《JAVA与模式》一…

阅读更多...

【Hadoop】Hadoop概述与核心组件

【Hadoop】Hadoop概述与核心组件

目录 Hadoop概述Hadoop 发展历史Hadoop 三大发行版本1.Apache Hadoop（常用）2.Cloudera Hadoop3.Hortonworks Hadoop优势优势总结——4高（高可靠、高扩展、高效、高容错） Hadoop组成1.HDFS管理者：NameNode（n…

阅读更多...

NCP1271D65R2G中文资料规格书PDF数据手册引脚图参数图片价格功能特性描述

NCP1271D65R2G中文资料规格书PDF数据手册引脚图参数图片价格功能特性描述

产品描述： NCP1271 是成功的 7 引脚电流模式 NCP12XX 系列的新一代引脚-引脚兼容新产品。该控制器通过使用可调节 Soft Skip 模式和集成的高电压启动 FET，实现了卓越的待机功耗。此专属 Soft Skip 还大大降低了噪音的风险。因此可以在箝位网络中使用不…

阅读更多...

SQLiteC/C++接口详细介绍之sqlite3类（四）

SQLiteC/C++接口详细介绍之sqlite3类（四）

快速跳转文章列表：SQLite—系列文章目录上一篇：SQLiteC/C接口详细介绍之sqlite3类（三） 下一篇：SQLiteC/C接口详细介绍之sqlite3类（五） 编写不易，有用的朋友点个赞或加粉一下万分感…

阅读更多...

java Day7 正则表达式|异常

java Day7 正则表达式|异常

文章目录 1、正则表达式1.1 常用1.2 字符串匹配，提取，分割 2、异常2.1 运行时异常2.2 编译时异常2.3 自定义异常2.3.1 自定义编译时异常2.3.2 自定义运行时异常 1、正则表达式就是由一些特定的字符组成，完成一个特定的规则可以用来校验数据…

阅读更多...

Qt/C++音视频开发69-保存监控pcm音频数据到mp4文件/监控录像/录像存储和回放/264/265/aac/pcm等

Qt/C++音视频开发69-保存监控pcm音频数据到mp4文件/监控录像/录像存储和回放/264/265/aac/pcm等

一、前言用ffmpeg做音视频保存到mp4文件，都会遇到一个问题，尤其是在视频监控行业，就是监控摄像头设置的音频是PCM/G711A/G711U，解码后对应的格式是pcm_s16be/pcm_alaw/pcm_mulaw，将这个原始的音频流保存到mp4文件是会…

阅读更多...

使用OpenCV实现两张图像融合在一起

使用OpenCV实现两张图像融合在一起

简单介绍图像融合技术是一种结合多个不同来源或不同传感器捕获的同一场景的图像数据，以生成一幅更全面、更高质量的单一图像的过程。这种技术广泛应用于遥感、医学影像分析、计算机视觉等多个领域。常见的图像融合技术包括基于像素级、特征级和决策级的融合方法&a…

阅读更多...

家具工厂5G智能制造数字孪生可视化平台，推进家具行业数字化转型

家具工厂5G智能制造数字孪生可视化平台，推进家具行业数字化转型

家具制造5G智能制造工厂数字孪生可视化平台，推进家具行业数字化转型。随着科技的飞速发展，家具制造业正迎来一场前所未有的数字化转型。在这场家具制造业转型中，5G智能制造工厂数字孪生可视化平台发挥着至关重要的作用。 5G智能制造工厂数字孪…

阅读更多...

Adobe PDF背景设置护眼模式，缓解眼部疲劳

Adobe PDF背景设置护眼模式，缓解眼部疲劳

一、背景在用Adobe PDF看论文时，默认的白色背景看久了，眼睛会特别疲劳，下面介绍如何设置背景为护眼模式。二、设置PDF为护眼模式使用Adobe Acrobat Pro DC打开任意PDF文件，在上方工具栏选择“编辑”，在下拉菜单栏…

阅读更多...

如何配置Apache的反向代理

如何配置Apache的反向代理

目录前言一、反向代理的工作原理二、Apache反向代理的配置 1. 安装Apache和相关模块 2. 配置反向代理规则 3. 重启Apache服务器三、常见的使用案例 1. 负载均衡 2. 缓存 3. SSL加密总结前言随着Web应用程序的不断发展和扩展，需要处理大量的请求和…

阅读更多...

最新文章

推荐文章