论文笔记:PTR: Prompt Tuning with Rules for Text Classification


Abstract

        手动设计大量语言提示麻烦且易出错,而自动生成的提示,在非小样本场景下验证其有效性昂贵且耗时。因此,提示调优以处理多类别分类任务仍然具有挑战。为此,本文提出使用规则进行多类别文本分类提示调优(PTR),并应用逻辑规则来构建带有多个子提示的提示。通过这种方式,PTR能够将每个类别的先验知识编码为提示调优。本文对文本分类进行了实验,一个典型而复杂的多类别分类任务。结果表明,PTR可以利用人类的先验知识和预训练语言模型来实现复杂的分类任务。

Introduction

        在Figure 1中,展示了预训练、微调和快速调优,这可以清楚地指出它们之间的联系和差异。       

        尽管微调PLMs取得了成功,但是最近一些研究发现,其关键挑战之一是预训练和微调之间差距,这限制了PLMs中知识的充分利用。以Figure 1为例,预训练通常形式化为完形填空任务来预测目标词,但微调中的下游任务可能表现出不同的客观形式,如分类、生成和序列标注等(二者之间的差距)。微调和下游任务之间的差距阻碍了PLMs中的知识转移和适应下游任务。  

       为了弥补预训练和下游任务之间的差距,提出了提示学习。如Figure 1所示的,典型的提示包括一个模板和一组标签词,其中标签词集用于预测[MASK]的候选集。通过将原始输入与用于预测[MASK]的提示模板融合,然后将预测的单词映射到相应的标签,提示调优可以将情感二分类任务转化为完形填空任务。

        对于具有很多类别的任务,手动找到合适的模板和标签词来区分不同的类别具有挑战性。自动生成的提示无法与人工选择的提示的性能比较,且自动生成提示需要额外的生成和验证计算成本,且更适合小样本学习,而不适合于具有大规模实例和类别的常规学习设置。

        PTR的两个优点

        1.先验知识编码:PTR可以应用逻辑规则来将与任务和类相关的先验知识编码到提示调优中。以RE为例,预测结果统称与关系语义和实体类型相关,本文可以使用两个字提示来为关系“person:parent” 和“organization: parent”构建提示,一个子提示用于确定标记的实体是人还是组织,另一个子提示则用于确定句子是否表达父子关系的语义。

        2.高效提示设计:设计几个简单的子提示,然后根据逻辑规则组合这些子提示以形成特定任务的提示

Prompting Tuning with Rules (PTR)

Overall Framework of PTR

        PTR由基本的人类逻辑推理驱动。例如,在关系分类中,如果想要知道一个句子中的两个标记实体是否具有关系“person: parent”,那么需要检查该句子和两个标记的实体是否满足条件:(1)两个标注实体是人;(2)该句子表示两个标注实体之间的父语义。

        PTR:

        设计了一个条件函数集F,每个条件函数f\in F用于判断Input是否满足某些条件。例如f\left ( x;person \right )可以确定输入x是否为person,f(x, 's parent was, y)可以确定y是否为x的parent。这些条件函数本质上是一阶逻辑的谓词。

        对于每个条件函数f\in F,PTR设置一个模板T_f\left ( \cdot \right )和一组标签词V_f来构建子提示。根据标签y的语义,可以使用逻辑规则将分类任务转换为一系列条件函数的计算。如Figure 2所示,确定实体x和y的关系是否为“person: parent”可以形式化为:

其中,f_{e_s}\left ( \cdot ,\cdot \right ) 是确定主体实体类型的条件函数,f_{e_o}\left ( \cdot ,\cdot \right )是确定客体实体类型的条件函数,f_{e_s, e_o}(\cdot ,\cdot ,\cdot )是确定实体之间语义关系的条件函数。

Sub-Prompts for Conditional Functions

        对于每个条件函数f\in F,为其手动设计了一个由模板和一组标签词组成的子提示。

        设置f_{e_s}(\cdot ,|person|organization|...)来确定头实体类型,子提示和标签词集合可以形式化为:

 对于关系,可以设置

子提示和标签词集合可以形式化为: 

Composing Sub-Prompts for Tasks 

        本文使用具有联合范式的逻辑规则,然后直接连接所有规则相关函数的子提示。

        通过聚合实体类型提示和关系提示,完整的提示模板如下:

对应的标签词集合如下:

 由于标签词模板中可能包含多个[MASK],所以必须考虑所有的掩码位置进行预测:

 Experiments

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/450972.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux发展与基础

Linux基础知识 Shell 命令执行环境: 命令提示符的组成:(用户名主机名)-[当前路径]权限提示符,例:(kali㉿kali)-[~]$ ~ 表示所在目录为家目录:其中root用户的家目录是/root,普通用户的家目录在/home下 # 表示用户的权…

C#学习笔记(二)

C#学习笔记(二) 第 二 章 命名空间和类、数据类型、变量和代码规范一、命名空间-namespace1. 作用与具体表达形式-using2. 命名空间如何分类?3. 命名空间的命名规范 第 二 章 命名空间和类、数据类型、变量和代码规范 深水区 一、命名空间-…

掌握高效工作汇报技巧:如何利用即时白板打造完美日报,提升职场影响力

在快节奏的工作环境中,撰写工作日报、周报和月报已成为职场人士的日常任务。一份精心准备的工作汇报不仅能够体现我们的敬业精神,还能吸引上级的注意,提升我们在团队中的能见度。使用即时白板作为辅助工具,可以让我们更高效地梳理…

分析调优、性能测试曲线图

目录 一、分析调优 性能测试分析的关键指标 分析步骤 收集数据: 找到瓶颈: 性能调优策略 调优硬件资源: 数据库调优: 持续监控和改进 二、性能测试曲线图 1. 轻负载阶段(Light Load) 2. 重负载…

mqtt客户端订阅一直重复连接?

文章 前言错误场景问题分析解决方案后言 前言 ✨✨ 他们是天生勇敢的开发者,我们创造bug,传播bug,毫不留情地消灭bug,在这个过程中我们创造了很多bug以供娱乐。 前端bug这里是博主总结的一些前端的bug以及解决方案,感兴…

D37【python 接口自动化学习】- python基础之函数

day37 函数的参数(上) 学习日期:20241014 学习目标:函数﹣-50 函数的参数:怎样实现函数与外部数据通信? 学习笔记: 实参与形参 代码实现 # 实参与形参 def foo(number):print(nu…

热更新解决方案2 —— Lua语法相关知识点

概述 开发环境搭建 Lua语法 1.第一个Lua程序 2.变量 print("******变量*******"); --lua当中的简单变量类型 -- nil number string boolean -- lua 中所有的变量声明 都不需要声明变量类型 它会自动的判断类型 -- 类似C# 中的var --lua中的一个变量 可以随便赋值 ——…

Python NumPy 在神经网络中的矩阵运算与激活函数详解

Python NumPy 在神经网络中的矩阵运算与激活函数详解 文章目录 Python NumPy 在神经网络中的矩阵运算与激活函数详解一 矩阵乘法回顾1 定义矩阵2 矩阵乘法计算 二 NumPy 矩阵乘法三 神经网络的分类与回归1 回归问题2 分类问题1)定义 sigmoid 函数2)定义学…

第十二章 RabbitMQ之失败消息处理策略

目录 一、引言 二、RepublishMessageRecoverer 实现 2.1. 实现步骤 2.2. 实现代码 2.2.1. 异常交换机队列回收期配置类 2.2.2. 常规交换机队列配置类 2.2.3. 消费者代码 2.2.4. 消费者yml配置 2.2.5. 生产者代码 2.2.6. 生产者yml配置 2.2.7. 运行效果 一、引言 …

爬虫逆向-js进阶(续写,搭建网站)

1.搭建简单网站1 from flask import Flask,render_template import requests import json app Flask(name)# **location**的温度是**temp**度,天气状况:**desc**app.route(/) # 绑定处理函数 def index_url():location 101010100data get_weather(lo…

Python画笔案例-086 turtle 多线程绘画

1、turtle 多线程绘画 通过 python 的turtle 库 多线程绘画,如下图: 2、实现代码 turtle 库 多线程绘画,以下为实现代码: """多线程绘画.py """ from random import random,randint from turtle import Turtle,Screen from threading

智慧光储充一体化能源管理策略

0引言 我国电动汽车的数量正在持续增长,然而,充电设施的发展却相对滞后,车与充电桩的比例远未达到规划目标。充电桩的建设面临着电网增容困难和盈利模式单一的问题。"光-储-充"一体化设备能够有效解决这些问题,通过夜间…

2024盐城大洋湾遇见迷鹿音乐节 首阵容公布开票!

生活不止一个方向,它是一场没有终点的旅行,是无尽的探索,是一次次的挑战与征服。你可以是自由的风,穿梭在城市的钢筋森林,或是旷野的无垠边际,无拘无束,只听从内心的呼唤。你可以是静止的树&…

Oracle云主机申请和使用教程:从注册到SSH连接的全过程

今天我要和大家分享如何成功申请Oracle云主机,并进行基本的配置和使用。我知道很多同行的朋友在申请Oracle云主机时都遇到了困难(疑惑abc错误),可能试了很多次都没有成功。现总结一下这些年来的一些注册流程经验,或许你们也能成功申请到自己的…

内嵌服务器Netty Http Server

内嵌式服务器不需要我们单独部署,列如SpringBoot默认内嵌服务器Tomcat,它运行在服务内部。使用Netty 编写一个 Http 服务器的程序,类似SpringMvc处理http请求那样。举例:xxl-job项目的核心包没有SpringMvc的Controller层,客户端却…

为什么Autosar钟情arxml而非json?大揭秘!

目录 往期推荐 JSON 的优缺点 优点: 缺点: XML 的优缺点 优点: 缺点: JSON与XML适用场景 Autosar选中arxml的原因 1. 复杂数据结构表示能力 2. 严格的数据验证和约束 3. AUTOSAR 历史与工具链的成熟度 4. 灵活的扩展性…

5555字的程序员脱单攻略,看了后悔一天,不看后悔一辈子!

目录 一、序言 二、破圈 三、打造社交魅力之形象改造 四、你知道怎么线下邀约女生吗 五、如何判断对方对你是否有后续 六、90%的人止步于心态上 七、内在力量的根源 一、序言 《对象说》 间歇性想找对象,持续性不想行动。 看着别人撒狗粮,躺在家…

回溯算法【组合 子集 全排列 N皇后】

大家好,最近一直在写算法,刷了力扣中部分回溯,总结了大致题型和思路,在这里分享给大家,希望大家可以有所收获!!! 目录 回溯算法的基本思想: 回溯的典型结构&#xff1a…

今日股市集体狂飙,下周一呢?

今日,中国人民银行与中国证监会联合印发《关于做好证券、基金、保险公司互换便利(SFISF)相关工作的通知》,向参与互换便利操作各方明确业务流程、操作要素、交易双方权利义务等内容。目前获准参与互换便利操作的证券、基金公司有2…

链上的羁绊,数据与节点的暗涌心跳

公主请阅 1. 合并两个有序链表1.1 题目说明示例 1示例 2示例 3 1.2 题目分析1.3 代码部分1.4 代码分析 2. 链表的中间节点2.1 题目说明示例 1示例 2 2.2 题目分析2.3 代码部分2.4 代码分析 1. 合并两个有序链表 题目传送门 1.1 题目说明 这个问题要求将两个升序链表合并成一个…