论文阅读——Recognizing Emotion Cause in Conversations

文章目录

  • 摘要
  • 引言
  • 相关工作
  • 任务定义
  • 构造RECCON数据集
  • 情绪原因的类型
  • 实验
    • 任务1:Causal Span Extraction
      • 模型
    • 任务2:Causal Emotion Entailment
      • 模型
  • 面临的挑战


摘要

识别文本中情绪背后的原因是NLP中一个未被探索的研究领域。这个领域的发展具有着改善情感模型可解释性和性能的潜力。由于说话者之间的动态交互性,对话中的话语级情绪原因识别极具挑战性。为此,我们引入对话中的情绪原因识别任务,并提出一个该任务的数据集RECCON,此外,我们根据原因的来源定义了不同的原因类型,并且在RECCON中的两个子任务:1)Causal Span Extranction 和 2)Causal Emoiton Entailment上建立了较强的基于transformer的基线。数据集地址为: https://github.com/declare-lab/RECCON.

引言

情感理解是AI中的一个关键部分,而语言经常暗示了一个人的情感。因此,考虑到情感识别在意见挖掘,推荐系统,医疗和其它领域的广泛应用,情感识别在NLP中受到了广泛关注。
文本或视频中的情感探测和分类方面已经有了很大的进展,然而到目前为止,关于情绪的进一步推理,比如理解一个说话者情绪的背后原因仍然很少被探索。
在这篇论文中,我们关注的是对话中的情绪原因识别。特别地,我们会在对话上下文中寻找能够触发目标话语中的情绪的events, situations, opinions or experiences。除了上述提及的事件,原因也可以是一个说话者对另一个说话者所关心事件的对应反应(人际交往之间的情绪影响)。
我们引入了对话中的情绪原因识别任务,这个原因可能出现在当前话语或者历史话语中。
所做贡献如下所示:

  • 我们提出了一个新的任务,并深入发掘了这个任务中的很多特性,而且定义了情绪原因的类型。
  • 我们为这个任务构造了一个数据集RECCON。
  • 我们提出了两个极具挑战性的子任务和对应的基线。

相关工作

主要是文本中的情感识别以及文本中的情绪原因识别(ECE和ECPE),而且在数据集中标注了多个片段来充分表示原因,同时提供了负样本:不包含原因片段的上下文。
作者在这块提到了数据集标注中遇到的挑战,包括:对话中的情绪并不总是显示的;对话非正式,很多原因是隐式的,需要推理;原因很可能距离目标华语非常远,识别它需要复杂的推理和指代消解。

任务定义

目标话语Ut、对话历史H(Ut)、原因片段集合CS(U)、utterane-causal span(UCS) pair即话语-原因片段对,S属于CS(U)。
该任务的目标是识别出给定文本中的所有的UCS对。如果这个对中的S属于CS(U),那么这个对就是positive example,如果不属于,那么这个对就是negative example。

构造RECCON数据集

考虑数据集:IEMOCAP和DailyDialog,两个数据集都有话语级的情感标签。
IEMOCAP是两人对话数据集,使用6个情感标签:happy,sad,netural,anger,excited,frustrated。数据集中的每个对话超过50个话语。
DailyDialog是一个覆盖日常生活话题的人类自然对话数据集,使用7个情感标签:anger,disgust,fear,happy,netural,sad,surprise。但是这个数据集超过83%都是中性标签,所以我们随机选择至少有4个非中性话语的对话。数据集中的每个对话平均8个话语。

标注者要求抽取原因片段,如果原因是隐式的,那么标注者将认为的原因写下来。每个话语由两个标注者标注。标注分成两个阶段,阶段1通过majority voting来决定哪个话语是原因话语,阶段2进行span-level的标注,我们会选择片段的并集作为最终原因片段,如果两个片段不重合,那么引入第三个标注者来决定最终的片段。
计算卡帕和宏F1来说明标注结果。
RECCON数据集统计信息

情绪原因的类型

根据原因的来源不同,观察到5种主要的类型:

  • No Context:原因显示地出现在目标话语当中。
  • Inter-personal Emotional Influence:原因出现在另一个说话者话语中,两种子类型:一种是另一个说话者提到地事件或概念;另一种是受到另一个说话者对于某些事件或场景地情绪影响。
  • Self-Contagion:自我情绪的传染,很多情况下,说话者会保持之前对话轮次的情绪。
  • Hybrid:第二种类型和第三种类型联合引发了情绪。
  • Unmentioned Latent Cause:目标话语及其对话历史中找不到显示的原因。

实验

任务1:Causal Span Extraction

任务1旨在识别目标话语的情绪原因片段。在我们的实验设置中,我们将该任务形式化为机器阅读理解任务,并提出两种片段抽取设置:带有上下文;不带上下文。

  • With Conversational Context:我们将构造实例(Context,Question,Answer),其中目标话语的对话历史中的所有话语拼接作为Context;在这里插入图片描述
    CS(Ut)中的Span作为Answer。
  • Without Conversational Context:此时Context只有Ui。

模型

  • RoBERTa Base:我们使用roberta-base和一个作用与隐藏层状态上的线性层用于计算开始和结束的位置。
  • SpanBERT Fine-tuned on SQuAD:我们使用在SQuAD 2.0上微调的SpanBERT base模型作为第二个基线模型。

评价指标有EMpos、F1pos、F1neg、F1。
在这里插入图片描述

任务2:Causal Emotion Entailment

任务2旨在识别出对话历史中触发目标话语情绪的原因话语。跟任务1的两种设置相同:带有上下文和不带上下文。

  • With Conversationnal Context:我们将这个问题看作一个三元做分类问题,三元组为(Ut,Ui,H(Ut)),如果Ui是原因话语,那么三元组分类为positive,否则为negative。
  • Without Conversational Context:二元句子对分类任务,(Ut,Ui)被分类为positive如果Ui为原因话语,否则为negative。

模型

  • Roberta Base/Large

评价指标为Pos.F1、Neg.F1、macro F1。
在这里插入图片描述

面临的挑战

  • 片段的数量:能够充分抽取出触发情绪的原因片段的集合是一个主要的挑战,这些片段应该能够形成一个逻辑推理。
  • 情绪的动态性:理解对话中的情绪动态性对于原因识别很重要,我们可以观察到很多对话中的原因是由另一个说话者谈到的事件或概念引起,或者是自我的一个影响。并且我们也可以看到它有时距离目标话语很多轮次远,因此还需要具有建模长期信息的能力。而且在标注中发现,情感信息非常重要。
  • 常识知识:常识知识在抽取情绪原因中发挥着重要作用,尤其当情绪原因是隐式的。
  • 复杂的共指消解:对话中的指代关系经常隐式。
  • 对话的非正式性和复杂的特性使得抽取出的原因并非最exact,而是perceived cause。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/20184.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文阅读:Question Answering Over Temporal Knowledge Graphs

论文阅读:Question Answering Over Temporal Knowledge Graphs 我们首先在我们的新数据集上应用大型预训练的基于 LM 的 QA 方法。 然后,我们将时间和非时间的 KG 嵌入注入到这些 LM 中,并观察到性能的显着提高。 我们还提出了一种新方法 CR…

学术论文写作以及discussions/results与conclusion的区别

经验帖 | 如何写SCI论文? Result、Discussion和Conclusion区别解析 如何写学术论文 一篇论文只能有一个主题,不能出现过多的研究问题,这样只会让文章读起来很乱。就像大牛经常讲的,“one paper, one story”,一篇论文…

微软杀疯了!几行代码创建私人定制ChatGPT,AI办公软件帝国来了

【导读】微软又用ChatGPT出逆天操作了!Power Virtual Agents和AI Builder推出了由Azure OpenAI服务支持的下一代AI功能。低代码技术,在彻底改变传统的开发格局。 微软真是逆天了。眼看,它就要用ChatGPT建起一个世最强办公软件帝国了&#xf…

ChatGPT 使用 拓展资料:2023年6月 吴恩达大咖Deeplearning.ai最新课程

ChatGPT 使用 拓展资料:2023年6月 吴恩达大咖Deeplearning.ai最新课程 Deeplearning.ai刚刚发布几个新的课程https://www.deeplearning.ai/short-courses/?utm_campaign=May%20Short%20Course%20Launch&utm_content=250952287&utm_medium=social&utm_source=link…

使用Python把树莓派改造成一个语音助手

CSDN广告邮件太多了,邮箱已经屏蔽了CSDN,留言请转SegmentFault:https://segmentfault.com/a/1190000014000349 语音助手已经不是什么新事物了。就在两三年前,语音助手的使用体验还不是那么好,尝尝鲜后也就没用过了。但…

AI对话-Free Chat免费无限制

目录 前言 使用方法 提问 推荐线路 前言 chat.4 和 chat.5 线路的响应改成通过在 Netlify 的部署来响应了。Netlify 不像 Vercel 那样还限制 Edge Function 的调用次数,很适合部署本项目。现在这两个线路的成本最低了,最优先推荐大家使用。 使用方法 提问 比如我问他:…

掌握唯米系统ChatGPT批量生成文章的操作技巧

以下是重写后的操作步骤: 1. 购买会员并添加个人的ChatGPT密钥: 首先,您需要购买唯米系统的会员,并获得访问ChatGPT的权限。随后,您可以将个人的ChatGPT密钥添加到系统中,以便使用该功能进行自然语言生成和…

ChatGPT批量生成文章软件:创意无限,智能驱动文章

随着人工智能技术的不断发展,ChatGPT批量生成文章软件成为了当今互联网世界中备受瞩目的创新之一。作为一种基于大规模预训练语言模型的自然语言处理工具,ChatGPT能够以人类般的方式与用户进行对话,并且能够生成高质量的文章。这一技术的出现…

ChatGPT3.5 AI智能高质量原创文章批量生成器 API方式多个key多线程写文章

1、ChatGPT3.5是一种基于自然语言处理技术的模型,可以模拟人类写作和思考的过程,生成通顺、有逻辑、富有创造性的文章。 2、使用ChatGPT3.5,您可以快速轻松地生成各种类型的文章,无论是新闻报道、产品说明、营销宣传、科技评论&a…

技术科普与解读:ChatGPT 大模型硬核解读!(一)家族历史从GPT-1到ChatGPT

多模态,指的是融合文本、图像、视频或音频等多种模态作为输入或输出。 GPT-4是严格意义上的多模态模型,可以支持图像和文字两类信息的同时输入,输出为文本。从学术界的分析来看,无论是知识/能力获取还是与现实物理世界的交互&…

【宏观经济学】chatGPT会让我们失业吗?

文章链接:chatGPT会让我们失业吗?

Transformer模型详解

2013年----word Embedding 2017年----Transformer 2018年----ELMo、Transformer-decoder、GPT-1、BERT 2019年----Transformer-XL、XLNet、GPT-2 2020年----GPT-3 Transformer 谷歌提出的Transformer模型,用全Attention的结构代替的LSTM,在翻译上取得了更…

阐述说明NLP发展历史,以及 NLP与chatgpt的关系

自然语言处理(Natural Language Processing,NLP)是人工智能(AI)领域的一个重要分支,关注计算机与人类(自然)语言之间的交互。NLP的目标是使计算机能够理解、生成和解释自然语言&…

【GPT】你需要了解的 ChatGPT的技术原理- Transformer架构及NLP技术演进

目录 概述 The Concept of Transformers and Training A Transformers ModelTransformers 的概念和训练 Transformers 模型

思科模拟器之端口聚合技术

端口聚合也叫做以太通道(ethernet channel),主要用于交换机之间连接。由于两个交换机之间有多条冗余链路的时候,STP会将其中的几条链路关闭,只保留一条,这样可以避免二层的环路产生。 工作原理&#xff1a…

如何在群晖NAS上安装cpolar内网穿透

系列文章 做内网穿透外网远程访问群晖NAS 1-2做内网穿透外网远程访问群晖NAS 2-2如何在群晖NAS上安装cpolar内网穿透配置群晖NAS中的cpolar开机自启动 1-2配置群晖NAS中的cpolar开机自启动 2-2为公网远程访问群晖NAS配置固定域名 1-2为公网远程访问群晖NAS配置固定域名 2-2 上…

如何使用cpolar内网穿透群晖NAS套件

系列文章 如何安装cpolar内网穿透群晖NAS套件如何使用cpolar内网穿透群晖NAS套件 上一篇: 如何安装cpolar内网穿透群晖NAS套件 在上一篇介绍里,我们在群晖系统中成功安装了图形化界面的cpolar,由于cpolar从命令行界面转入图形化界面&#xf…

QNAP威联通NAS搭建SFTP服务,并内网穿透实现公网远程访问

文章目录 前言1. 威联通NAS启用SFTP2. 测试局域网访问3. 内网穿透3.1 威联通安装cpolar内网穿透3.2 创建隧道3.3 测试公网远程访问 4. 配置固定公网TCP端口地址4.1 保留一个固定TCP端口地址4.2 配置固定TCP端口地址4.3 测试使用固定TCP端口地址远程连接威联通SFTP 转载自远程内…

cpolar内网穿透将本地的论坛网站发布公网访问 2/2

在上篇文章中,我们成功的在本地部署了一个论坛网站,我们有了邀请同事或游友加入并分享各自的想法和乐趣的基础。现在,我们就要通过cpolar建立一条长期稳定存续的数据隧道,并通过这个数据隧道,将这个论坛发布到公共互联…

华为防火墙地址映射(NATserver)

287、实验:NATserver映射 实验topo: 将内网DMZ安全域的http服务映射出外网,并且不让DMZ的服务器主动去访问外网: 做完策略之后点击诊断,测试服务器的存活性: 做安全策略,允许local访问dmz&#…