[论文笔记]Prefix Tuning

[论文笔记]Prefix Tuning

news/2024/11/24 19:04:36/文章来源:https://blog.csdn.net/yjw123456/article/details/133100386

引言

今天带来微调LLM的第二篇论文笔记Prefix-Tuning。

作者提出了用于自然语言生成任务的prefix-tuning(前缀微调)的方法，固定语言模型的参数而优化一些连续的任务相关的向量，称为prefix。受到了语言模型提示词的启发，允许后续的token序列注意到这些prefix，当成虚拟token。

只需要修改0.1%的参数量，在全量数据设定下，前缀微调能获得较好的效果；而在少数据设定下，它的表示甚至超过了全量微调，并且泛化能力更好。

总体介绍

全量微调需要保存原始模型的完全参数拷贝，这是非常耗费资源的。一种解决这个问题的自然选择是轻量微调(lightweight fine-tuning)，固定住大多数参数仅调整少部分。比如我们上次介绍的Adapter微调通过插入任务相关的额外层，在自然语言理解和生成任务上获得了不错的表现。

GPT-3通过上下文学习(in-context learning)，一种提示词的形式，不需要调整任何LM的参数。比如针对摘要任务的TL;DR，以及添加少部分样本到输入中，然后LM生成任务相关的输出。然而这种方法受限于输入的长度，上下文学习只能限定少量的训练样本。

考虑生成一个关于表格数据描述内容的任务，如图1所示。输入是一个线性的表格，比如name: Starbucks | type: coffee s

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/139756.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Go的error接口

Go的error接口

从本书的开始，我们就已经创建和使用过神秘的预定义error类型，而且没有解释它究竟是什么。实际上它就是interface类型，这个类型有一个返回错误信息的单一方法： type error interface { Error() string } 创建一个error最简单的方…

阅读更多...

高效查询大量快递信息，轻松掌握技巧

高效查询大量快递信息，轻松掌握技巧

在如今快节奏的生活中，快递已经成为我们日常不可或缺的一部分。然而，对于一些忙碌的人来说，单个查询每一个快递单号可能会浪费太多时间。因此，我们需要一款可以帮助我们批量查询快递的软件。在市场上，有很多款专门用于…

阅读更多...

网络知识——局域网和交换机

网络知识——局域网和交换机

定义： 局域网（Local Area Network，简称LAN）是指在某一区域内由多台计算机互联成的计算机组。广域网（Wide Area Network，简称WAN）是指跨越单个建筑物或大型园区，连接分布在特定地理区…

阅读更多...

面向嵌入式系统的轻量级框架分析

面向嵌入式系统的轻量级框架分析

mr-library简介 mr-library 是一个面向嵌入式系统的轻量级框架，提供统一的底层驱动设备模型以及基础服务功能，具有模块化设计、可配置性和扩展性的特点， 可帮助开发者快速构建嵌入式应用程序。 mr-library 框架支持互斥锁、对象管理等基础内…

阅读更多...

Aqs独占/共享模式

Aqs独占/共享模式

独占锁和共享锁的概念独占锁也叫排他锁，是指该锁一次只能被一个线程所持有。如果线程T对数据A加上排他锁后，则其他线程不能再对A加任何类型的锁。获得排它锁的线程即能读数据又能修改数据。共享锁是指该锁可被多个线程所持有。如果线程T对数据A加上共…

阅读更多...

Flume最简单使用

Flume最简单使用

文章目录一、简介1、定义2、基础架构二、快速入门1、解压Flume2、案例一：监控端口号3、案例二：将空目录下文件三、Flume进阶1、Flume事务2、Flume Agent内部原理3、案例一：监控日志4、案例二：多路复用和拦截器适应4.1 原理4.2 …

阅读更多...

Linux 操作技巧

Linux 操作技巧

目录一、shell-命令解释器二、Linux中的特殊符号三、命令历史--history 一、shell-命令解释器 shell——壳，命令解释器，负责解析用户输入的命令 ——内置命令（shell内置） ——外置命令，在文件系统的某个目录下&…

阅读更多...

【学习草稿】背包问题

【学习草稿】背包问题

一、01背包问题图解详细解析 （转载） https://blog.csdn.net/qq_37767455/article/details/99086678 ：Vi表示第 i 个物品的价值，Wi表示第 i 个物品的体积，定义V(i,j)：当前背包容量 j，前 i 个物…

阅读更多...

2010-2017年WIND分省政府性债务余额面板数据

2010-2017年WIND分省政府性债务余额面板数据

2010-2017年WIND分省政府性债务余额面板数据 1、时间：2010-2017年 2、指标：债务余额 3、范围：30个省 4、来源：wind 5、指标解释：地方政府债务分为一般债务和专项债务。一般债务对应的是一般公共预算&#xff0c…

阅读更多...

方案：浅析利用AI智能识别与视频监控技术打造智慧水产养殖监管系统

方案：浅析利用AI智能识别与视频监控技术打造智慧水产养殖监管系统

一、方案背景针对目前水产养殖集约、高产、高效、生态、安全的发展需求，基于智能传感、智慧物联网、人工智能、视频监控等技术打造智慧水产系统，成为当前行业的发展趋势。传统的人工观察水产养殖方式较为单一，难以及时发现人员非法入侵、偷…

阅读更多...

跨域问题解决方案（三种）

跨域问题解决方案（三种）

Same Origin Policy同源策略（SOP） 具有相同的Origin，也即是拥有相同的协议、主机地址以及端口。一旦这三项数据中有一项不同，那么该资源就将被认为是从不同的Origin得来的，进而不被允许访问。 Cross-origin resource…

阅读更多...

SpringBean的生命周期

SpringBean的生命周期

SpringBean的生命周期 SperingBean的生命周期是从Bean实例化之后，即通过反射创建出对象之后，到Bean成为一个完整对象，最终存储到单例池中，这个过程被称为Spring Bean的生命周期。Spring Bean的生命周期大体上分为三个阶段 Bean的…

阅读更多...

Win7开启触摸键盘方法

Win7开启触摸键盘方法

在Win7系统中，自带有触摸屏幕键盘，能够在屏幕上显示虚拟键盘，让用户可以用指针设备或触屏等进行输入操作，那么Win7系统怎么开启触摸键盘呢？想知道的小伙伴可以跟着我一起来学习一下。 1、首先打开Win7系统的开始菜单&a…

阅读更多...

小程序中如何查看会员的访问记录

小程序中如何查看会员的访问记录

在小程序中，我们可以通过如下方式来查看会员的访问记录。下面是具体的操作流程： 1. 找到指定的会员卡。在管理员后台->会员管理处，找到需要查看访客记录的会员卡。也支持对会员卡按卡号、手机号和等级进行搜索。 2. 查看会员卡详情。点…

阅读更多...

Smart UI Web 16.0.1 WebComponents htmlelements Crack

Smart UI Web 16.0.1 WebComponents htmlelements Crack

Javascript Web 组件库 Smart UI Web 组件库是您构建令人惊叹的 Web 应用程序所需的唯一套件。它包含 70 多个快速且专业设计的 UI 组件，可在单个包中实现美观且始终现代的 Web 应用程序。具有高级功能的即用型Javascript 组件。只需几行代码即可使用数据网格、甘特…

阅读更多...

解决编译中遇到的问题：Please port gnulib freadahead.c to your platform

解决编译中遇到的问题：Please port gnulib freadahead.c to your platform

今天在编译旧版的gzip-1.7时遇到了一个错误： error: #error "Please port gnulib freadahead.c to your platform! Look at the definition of fflush, fread, ungetc on your system, then report this to bug-gnulib." 在网上搜了一下解决方法&#xf…

阅读更多...

400电话申请流程详解，助您快速办理联通、移动、电信400电话

400电话申请流程详解，助您快速办理联通、移动、电信400电话

导语：随着企业业务的发展，越来越多的企业开始关注400电话的申请与办理。本文将为您详细介绍联通、移动、电信400电话的申请流程，帮助您快速办理400电话，提升企业形象和客户服务质量。一、联通400电话申请流程咨询与选择&#x…

阅读更多...

nginx知识点详解：反向代理+负载均衡+动静分离+高可用集群

nginx知识点详解：反向代理+负载均衡+动静分离+高可用集群

一、nginx基本概念 1. nginx是什么，做什么事情？ Nginx是一个高性能的HTTP和反向代理服务器，特点是占有内存少，并发能力强。Nginx转为性能优化而开发，能经受高负载考验。支持热部署，启动容易，运…

阅读更多...

Avl树(有详细图解)

Avl树(有详细图解)

目录介绍引入概念特点模拟实现思路插入旋转左旋无子树有子树右旋无子树有子树左右旋引入(也就是有子树版本的抽象图解) 解决方法(也就是左右旋) 总结无子树(也就是curright的位置就是newnode) 有子树模型高度解释旋转更新三个…

阅读更多...

资料分析笔记

资料分析笔记

统计术语现期：现在的时间基期：之前的时间现期量基期量增长量（有正负） 增长率【增幅、增速、r】（有正负） 同比：例：2014年5月和 2013年5月环比：例：20…

阅读更多...

最新文章

推荐文章