【论文阅读】通过解缠绕表示学习提升领域泛化能力用于主题感知的作文评分

news/2024/12/23 21:02:31/文章来源:https://blog.csdn.net/GW_Krystal/article/details/131834767

摘要

本文工作聚焦于从领域泛化的视角提升AES模型的泛化能力，在该情况下，目标主题的数据在训练时不能被获得。
本文提出了一个主题感知的神经AES模型（PANN）来抽取用于作文评分的综合的表示，包括主题无关（prompt-invariant）和主题相关（prompt-specific）的特征。
为了提升表示的泛化能力，我们进一步提出了一个新的解缠绕表示学习框架（disentangled representation learning）。在这个框架中，设计了一个对比的模长-角度对齐策略（norm-angular alignment）和一个反事实自训练策略（counterfactual self-training）用于解开表示中主题无关和主题相关的特征信息。

引言

本文提出一个主题感知的神经AES模型，它能够基于一篇作文的编码器（比如说预训练的BERT）来抽取作文的质量特征，并且基于一个文本匹配模块来抽取主题遵循度特征。
存在两个问题：
- 从编码器中抽取到的作文质量特征，比如BERT，可能编码了质量和内容信息，并且它们在特征中是相互缠绕的。怎样从特征中解开独立的质量信息是第一个问题；
- 主题关联特征和作文质量特征都是基于作文抽取得到的。因此，从因果的角度看，作文是两种特征的混淆因素，导致主题关联度和作文质量间的有误导性的关联。比如，一篇作文可能有不同的主题关联性但是一样的质量，在不同的主题下。所以，怎样解开这种误导性的关联，使得这两种特征独立得贡献于最终的分数是第二个问题。

方法

解缠绕表示学习框架（DRL）是基于预训练和微调的范式进行设计的。
- 在预训练阶段，设计了一个对比的norm-angular对齐策略来预训练文章质量特征，目的是解绑特征中的质量和内容信息。
- 在微调阶段，应用了一个反事实自训练策略来微调整个PANN模型，目的是解绑文章质量特征和主题相关特征之间的误导性的关联。
- 最后，使用完全训练好的PANN来评分目标主题的作文。

PANN的模型架构

三个主要组成：
- 作文质量网络（EQ-net）：只把作文作为输入，抽取主题无关的作文质量特征。
- 主题关联网络（PA-net）：把作文和主题都作为输入，抽取主题特定的主题遵循度特征。因为这样的基于交互的文本匹配模型能够只关注作文和主题的词级的相似度，它能够避免编码到和作文质量相关的信息，比如句法和内聚力，从而使得特征只特定于主题遵循度。
- 作文评分预测器（ESP）：结合两种特征来预测整体分数。
解缠绕表示学习DRL
- EQ-net可能会编码主题无关的质量信息和主题相关的内容信息，并且内容信息会在不同主题间切换，它会阻止EQ-net的泛化能力。
- 并且，PA-net和EQ-net都把作文作为输入，这使得作文变成主题关联度特征和作文质量特征的混淆因素，导致他们之间具有误导性的关联。

质量-内容解缠（Quality-Content Disentanglement）

我们提出了一个对比的模长-角度对齐策略（Contrastive Norm-Angular Alignment，CNAA）来在作文质量特征中的质量和内容信息。
这个策略的设计是基于模长不变性（norm invariant）和角度切换（angular shift）的假设，它假设质量和内容信息能够通过分别对齐就模长和角度而言的特征来被解绑。
对于模长不变性，我们假设相似质量的作文能够本分布具有相似的模长，并且这些模长可能是各个主题都不变的。
对于角度切换，我们假设具有相似内容的作文（i.e.,主题）能够被分布具有相似的角度，但是这些角度应该在不同的主题上切换。

数据增强

在这里插入图片描述

为了准备数据用于对比的模长-角度对齐，我们首先从训练集中抽取所有的高分和低分作文来组成原始数据 $D_o$ 。
通过两两拼接这些作文来构建衍生的数据 $D_d$ 。
随机降低分数给拼接后的作文的原因是：
- 拼接两篇文章可能会降低那篇更高分数的作文的质量（比如，内聚力和组织）。
- 拼接来自不同主题的两篇文章可能会降低作文的主题遵循度（对两个主题都是）。

模长不变性&角度切换对齐

基于成对的对比学习，包括模长不变的质量对齐和角度切换的内容对齐。

质量-遵循度解缠（Quality-Content Disentanglement）

本文尝试提出和回答以下问题：“如果一篇文章的质量保持不变，但它的题目符合度不同，那么最终得分会是多少？”

预评分指导的自训练

本文把每个反事实实例的预打好的预分数和模型预测的伪分数结合作为它的最终分数。以这种方式，在预分数中提供的先验知识和编码在伪分数中的模型知识能够被很好得融合。

实验

ASAP数据集和TOEFL11数据集

实验结果

我们和主题泛化设置的方法进行比较，包括三类方法：基于手工特征的，基于神经网络的和混合的。
可以看到，我们的PANN模型能够超过大多数的基准方法，在两个数据集上都达到最好的整体性能。这表明我们的方法对于主题泛化的作文评分是有用的。

在这里插入图片描述

结合PA-net和EQ-net两个部分比单独的PA-net或者EQ-net的性能好。这表明PA-net和EQ-net都能够为作文评分提供有用的信息。
当EQ-net被用NIA和ASA预训练，EQ-net的性能被提升。但是当EQ-net被只有他们中的一个预训练的时候，在TOEFL11数据集上性能下降了。相似的现象也可以在PA-net+EQ-net上观察到。这可能是由于两个损失需要被同时使用来解开质量和内容信息的缠绕。
并且，CTS也需要和CNAA策略一起使用来获得更好的性能。

进一步分析

在这里插入图片描述

数据增强的影响：可以发现PANN和EQ-net能够从数据增强中受益，特别是在ASAP的P3上，和TOEFL11数据集的P5上。

在这里插入图片描述

PA-net的影响：是否PA-net能够独立的影响最终的分数预测。可以看到，PANN为在不匹配的主题下的高分作文预测了平均更低的分数；由于EQ-net在两种设置下输出的特征是不变的，所以PA-net能够感知主题上的变化，能够独立影响分数预测。
数据大小的影响：在数据大小增大时，我们的PANN的预测性能相应提升，但是BERT的性能先上升后下降。这表明我们的表示解缠绕策略能够处理主题个数增长时带来的缠绕的信息的问题，所以模型能够从数据增长中获益。

特征可视化

在这里插入图片描述

展示了EQ-net有和没有CNAA策略时的特征分布。
(a)图三个等级的分数相对很好的分开了（left），但是不同主题的作文没有完全分开，特别时低分和中等分数的作文。
(b)图中使用了本文的CNAA策略，分数能够很好的分开根据不同的模长，主题能够很好的分开根据不同的角的方向。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/74188.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【MySQL】表的增删查改

【MySQL】表的增删查改

文章目录一、创建表create二、查看表desc三、修改表3.1 修改表名alter3.2 在表中插入数据insert3.3 在表中新增字段alter3.4 修改指定列的属性alter3.5 移除表中的一列alter3.6 修改表中某一列的列名alter 四、删除表drop 一、创建表create mysql> create table if not ex…

阅读更多...

Python爬虫教程篇+图形化整理数据（数学建模可用）

Python爬虫教程篇+图形化整理数据（数学建模可用）

一、首先我们先看要求 1.写一个爬虫程序 2、爬取目标网站数据，关键项不能少于5项。 3、存储数据到数据库，可以进行增删改查操作。 4、扩展：将库中数据进行可视化展示。二、操作步骤： 首先我们根据要求找到一个适合自己的网…

阅读更多...

【深度学习】High-Resolution Image Synthesis with Latent Diffusion Models，论文

【深度学习】High-Resolution Image Synthesis with Latent Diffusion Models，论文

13 Apr 2022 论文：https://arxiv.org/abs/2112.10752 代码：https://github.com/CompVis/latent-diffusion 文章目录 PS基本概念运作原理 AbstractIntroductionRelated WorkMethodPerceptual Image CompressionLatent Diffusion Models Conditioning Mec…

阅读更多...

ERROR 1064 - You have an error in your SQL syntax；

ERROR 1064 - You have an error in your SQL syntax；

ERROR 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near (/, 少个逗号吧，以前开始写SQL，特别是修改SQL的时候容易出现这样错误。而且自己也知道在附近…

阅读更多...

应用案例｜基于高精度3D视觉引导压缩机抓取定位应用

应用案例｜基于高精度3D视觉引导压缩机抓取定位应用

Part.1 行业现状 3D机器视觉是一种新兴的人工智能技术，它在机器视觉和机器学习领域中发挥着重要的作用。在工业领域，3D视觉技术被广泛应用于引导工业机器人进行抓取和定位操作。使用显扬科技的技术可以实现识别和定位压缩机。 Part.2 如何识别和定位压缩…

阅读更多...

SpringBoot+ruoyi框架图片上传和文件下载

SpringBoot+ruoyi框架图片上传和文件下载

第一次接触ruoyi框架，碰到文件上传和下载问题，今天来总结一下。使用若依框架文件上传下载首先配置文件路径要配好。文件下载： application.yml若依配置 # 项目相关配置 ruoyi:# 名称name: RuoYi# 版本version: 3.6.0# 版权年份copyright…

阅读更多...

Compose应用案例（利用docker compose安装lnmp实例）

Compose应用案例（利用docker compose安装lnmp实例）

目录 Compose应用案例一、前提配置 （一）安装docker-ce（Linux安装Docker） （二）安装docker-compose 二、安装docker compose部署lnmp （一）目录结构： （二…

阅读更多...

MQTT服务器详细介绍：连接物联网的通信枢纽

MQTT服务器详细介绍：连接物联网的通信枢纽

随着物联网技术的不断发展，MQTT（Message Queuing Telemetry Transport）协议作为一种轻量级、可靠、灵活的通信协议，被广泛应用于物联网领域。在MQTT系统中，MQTT服务器扮演着重要的角色，作为连接物联网设备和…

阅读更多...

布隆过滤器

布隆过滤器

文章目录布隆过滤器布隆过滤器的概念布隆过滤器的插入布隆过滤器的删除布隆过滤器布隆过滤器就是为了解决位图不能解决的问题。用哈希表存储用户记录，缺点：浪费空间用位图存储用户记录，缺点：不能处理哈希冲突将哈希与位图结合…

阅读更多...

「干货分享」针对电机控制应用如何选择宽带隙器件？

「干货分享」针对电机控制应用如何选择宽带隙器件？

在功率转换应用中，使用碳化硅（SiC）和氮化镓（GaN）材料的宽带隙（WBG）半导体器件作为开关，能让开关性能更接近理想状态。相比硅MOSFET或IGBT，宽带隙器件的静态和动态损耗都更…

阅读更多...

【javaSE】实现图书管理系统

【javaSE】实现图书管理系统

目录整体思路 Book包 Book类 BookList类 user包 User类 NormalUser类 AdminUser管理员类 testmain包 opera包 IOPeration接口普通用户 ExitOperation类 FindOperation类 BrrowOperation类 ReturnOperation类管理员 AddOperation类 DelOperation类 ShowOp…

阅读更多...

Jmeter自动化性能测试常见问题

Jmeter自动化性能测试常见问题

一、request 请求超时设置 timeout 超时时间是可以手动设置的，新建一个 http 请求，在“高级”设置中找到“超时”设置，设置连接、响应时间为2000ms。 1. 请求连接超时，连不上服务器。现象： Jmeter表现形式为&…

阅读更多...

视频爬虫：解析m3u8文件 python m3u8库，m3u8文件中.ts视频流的解密下载

视频爬虫：解析m3u8文件 python m3u8库，m3u8文件中.ts视频流的解密下载

一、引用的库这里需要引用的库是：from Crypto.Cipher import AES 有坑哈，python3.0之后直接安装crypto你会发现不管怎么着都会报错。经过查找资料找到了原因，原来是20年之后crypto已经被pycryptohome替换掉啦， 如果之前安装过…

阅读更多...

什么是高级持续威胁(APT)攻击

什么是高级持续威胁(APT)攻击

目录前言什么是高级持续威胁高级持续威胁攻击有哪些独特特征APT攻击的五个阶段APT检测及防护措施总结前言 APT攻击是利用多个阶段和不同攻击技术的复合网络攻击。APT不是一时兴起2构思或实施的攻击。相反，攻击者故意针对特定目标定制攻击策略。并在较长时间内进行…

阅读更多...

【Spring Boot系列】-Spring Boot过滤器Filter

【Spring Boot系列】-Spring Boot过滤器Filter

【Spring Boot系列】-Spring Boot过滤器Filter 文章目录【Spring Boot系列】-Spring Boot过滤器Filter一、概述二、Filter（过滤器）数据流程三、Spring Boot 过滤器生命周期四、使用注解方式实现过滤器(WebFilter)4.1. 在springboot 启动类添加该注解Ser…

阅读更多...

flutter开发实战-实现css线性渐变转换flutter渐变LinearGradient功能

flutter开发实战-实现css线性渐变转换flutter渐变LinearGradient功能

flutter开发实战-实现css线性渐变转换flutter渐变LinearGradient功能在之前项目开发中，遇到更换样式，由于从服务器端获取的样式均为css属性值，需要将其转换成flutter类对应的属性值。这里只处理线性渐变linear-gradient 比如渐变 “linear-…

阅读更多...

SQL编译优化原理

SQL编译优化原理

最近在团队的OLAP引擎上做了一些SQL编译优化的工作，整理到了语雀上，也顺便发在博客上了。SQL编译优化理论并不复杂，只需要掌握一些关系代数的基础就比较好理解；比较困难的在于reorder算法部分。文章目录基础概念关系代数等价 j…

阅读更多...

python-网络爬虫.BS4

python-网络爬虫.BS4

BS4 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库， 它能够通过你喜欢的转换器实现惯用的文档导航、查找、修改文档的方式。 Beautiful Soup 4 官方文档：https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ 帮助手册&…

阅读更多...

【element-ui】form表单初始化页面如何取消自动校验rules

【element-ui】form表单初始化页面如何取消自动校验rules

问题描述：elementUI表单提交页面，初始化页面是获取接口数据，给form赋值，但是有时候这些会是空值情况，如果是空值，再给form表单赋值的话，页面初始化时候进行rules校验会不通过，此时前…

阅读更多...

在excel中整理sql语句

在excel中整理sql语句

数据准备 CREATE TABLE t_test (id varchar(32) NOT NULL,title varchar(255) DEFAULT NULL,date datetime DEFAULT NULL ) ENGINEInnoDB DEFAULT CHARSETutf8mb4; INSERT INTO t_test VALUES (87896cf20b5a4043b841351c2fd9271f,张三1,2023/6/8 14:06); INSERT INTO t_test …

阅读更多...

最新文章

推荐文章