【论文速递】ACM MM 2022 - 基于统一对比学习框架的新闻多媒体事件抽取

【论文速递】ACM MM 2022 - 基于统一对比学习框架的新闻多媒体事件抽取

【论文原文】:Multimedia Event Extraction From News With a Unified Contrastive Learning Framework

【作者信息】:Liu, Jian and Chen, Yufeng and Xu, Jinan

论文:https://dl.acm.org/doi/pdf/10.1145/3503161.3548132代码:https://github.com/jianliu-ml/Multimedia-EE

博主关键词:对比学习、多媒体事件抽取、图像表征学习

推荐论文:无

摘要

从新闻中提取事件在下游应用程序中有很多好处。然而,今天的事件提取(EE)系统通常专注于单一的模态——无论是文本还是图像,并且由于新闻文档通常以多媒体格式呈现,因此这种方法会受到信息不完整的影响。在本文中,我们提出了一种新的多媒体EE方法,通过使用统一的对比学习框架桥接文本和视觉模式。我们的中心思想是为文本和图像创建一个共享空间,以改善它们的相似表示。这通常是通过对文本图像对进行训练来实现的,我们证明,通过研究另一种模态的互补性,可以使用该框架来促进一种模态学习。在基准数据集上,我们的方法实现了一个新的最先进的性能,并显示F1提高了3%。此外,我们证明,即使在视觉模态中没有标注数据的零样本场景中,它也可以实现视觉模态EE最前沿性能。

1、简介

在这里插入图片描述

目前的EE方法主要用于单一形式——文本或图像[16],并且由于新闻文章通常以多媒体格式呈现,因此它们存在获取不完整信息的风险。考虑图1所示的新闻文章。本文描述了一个攻击事件(用文本单词“fires”表示);然而,事件的一个论点,即[machine gun],只出现在图片中。根据先前的研究,超过30%的新闻图像包含文本中不存在的视觉事件论点[16],使得多媒体EE成为一个关键话题。

多媒体EE的发展有两个主要障碍。第一个是数据问题:由于标注昂贵,标记有并行文本视觉事件的资源有限。现有数据集,如文本模态中的ACE 2005语料库[20]和视觉模态中的imSitu语料库[31],具有完全不同的事件定义/模式,使得跨模态数据共享具有挑战性。第二个问题与建模有关-由于缺乏并行数据,先前的多媒体EE方法通常使用流水线方法和启发式规则来对齐数据[28,33]并学习模态不变模式(例如,使用绑定分类器[16])。然而,这些方法存在一定的缺陷,流水线方法会存在错误传递,学习模态不变模式很难在全局角度捕捉不同模态的依赖性。

在这项研究中,我们提供了一种新的多媒体EE方法,展示了有效应对上述挑战的优势。与之前的工作相比,我们的方法通过统一的对比学习框架为图像、文本和事件模式创建了共享的表示空间。我们证明,使用该框架,任何配对的文本图像资源,无论模式如何,都可以用于模型训练,这大大减轻了缺少并行标记数据的问题。另一方面,该框架避免了管道方法的复杂性,并能够从整体角度对不同模式的相互依赖性进行建模。特别是,给定一个多媒体文档,1)我们可以将图像投影到联合表示空间中,并将其用作增强文本EE的额外证据,2)类似地,我们可以将文本投影到联合表达空间中,以找到增强视觉EE的补充线索。此外,通过评估句子和图像的相似性,这种联合空间自然能够实现跨模态事件的共同参考。

我们基于M2E2基准评估了我们的方法[16]。根据结果,我们的方法显著优于以前的方法(包括单模态方法和多模态方法),在F1中,事件提取和事件论元提取分别提高了2.6%和3.4%-这显然证明了其有效性。有趣的是,通过使用这种对比学习框架,我们发现,即使在没有用于训练的训练数据的零样本场景中,我们的方法也能达到与最先进方法相比的竞争性能。此外,我们进行了一系列定性和定量研究,以调查我们方法的优点和缺点。

总之,我们有三个贡献:

  • 我们为多媒体EE提供了一种新的方法,该方法使用统一的对比学习框架来解决数据和模型挑战。作为一项研究多媒体EE对比学习的开创性研究,我们的工作可能会启发这方面的更多研究。
  • 我们表明,使用我们的统一框架,无论其标注模式如何,都可以利用不同模式的资源进行学习。此外,通过采用整体建模方法,该统一解决方案避免了管道方法的复杂性。
  • 我们根据标准基准建立了新的最先进性能。此外,我们还表明,即使在零样本场景中,我们的方法也能与以前的视觉EE方法相媲美。

2、方法

图2描述了我们方法的高级概述。特别是,我们首先引入了一个对比学习框架来学习图像、文本和事件本体(例如,事件类型和语义角色)的共享表示空间。然后,使用这个共享空间,我们进行文本和视觉EE,以将补充信息合并到其他模态中。最后,我们执行具有相似性度量的跨模态事件共同参考过程,以组合来自多个模态的事件。我们的方法的技术细节如下。

4、实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

【论文速递 | 精选】

论坛地址:https://bbs.csdn.net/forums/paper

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37185.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JoVE微生物组专刊征稿,写方法拍视频教程发SCI(宏基因组公众号专属福利)

JoVE 视频实验杂志 官网:https://www.jove.com/ 包括上万个实验和分析方法视频,还有几十个领域的数百个专业视频教程资源。 这个杂志被SCI收录了吗?必须的。杂志在Web of Science中JCR信息如下: 2年影响因子 1.1,5年影…

2020年, video captioning论文汇总

目录 CVPR2020:ORG-TRLCVPR2020:STG-KDTIP2020:OSTGTPAMI2020:SibNet(MM2018)WACV2020:DSDWACV2020:STaTS CVPR2020:ORG-TRL 题目 Object Relational Graph with Teache…

深度学习顶会论文投稿策略7步走(附资料)

科研论文,不同于毕业论文之处在于——科研论文是根据有价值的生产实践或科研课题写作的,具有原创性和独到性的论文。 在学术界,有人写论文是为了升硕士,升博士或者研究生博士顺利毕业。毕竟在学术界论文是工作和科研水平的直观体现…

最新最全论文合集——AAAI 历年最佳论文汇总

AMiner平台(https://www.aminer.cn)由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上…

论文分享:2020小样本学习综述

目录 题目与文章脉络S1 介绍1.1 FSL1.2 FSL应用场景1.3 FSL术语定义 S2 概述2.1 定义&分类&应用2.2 相关机器学习问题2.3 FSL核心问题2.4 FSL方法分类2.5 FSL方法研究现状 S3 数据3.1 数据扩充方法3.2 数据扩充方法的GAP S4 模型4.1 模型选择方法4.2 模型选择方法的GAP…

MICCAI2019论文分享 PART①

刚刚结束的 MICCAI2019 会议的论文集分为6个部分,这段时间刷了一遍 Part I,在这儿和大家做一个简单的分享交流 由于本人主要专注于分割领域和半监督弱监督等学习策略,下面给出的综述可能多涉及该方向。选出的文章主要突出其中的闪光点&#…

写论文有哪些神网站?

来源:https://www.zhihu.com/question/35931336 编辑:深度学习与计算机视觉 声明:仅做学术分享,侵删 作者:匿名用户https://www.zhihu.com/question/35931336/answer/66552275 1.学术网站大全推荐理由:包含…

分享几个写英文论文的网页和软件

多个批量修改英语写作语法错误的工具可以修改英文文章里的语法错误,修改效率极高,而且都是免费的。: 1.1Checker,使用地址:1Checker http://www.1checker.com/Home/Index 2.ginger http://www.gingersoftware.com/&…

你写论文时发现了哪些神网站?

周不润 ,神经科学 收录于 编辑推荐 • 18860 人赞同 神网站算不上,都是一些为写作带来便利的网站。而且作为一些最常用网站的替代品,这些网站有的更精确,有的更便捷。 (16.02.27 更新) 以下内容包括&#…

【论文推荐】了解《视频预测》必看的6篇论文(附打包下载地址)

论文推荐 “SFFAI135期来自中国科学院计算技术研究所博士在读的常峥推荐的文章主要关注于计算机视觉的视频预测领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。” 关注文章公众号 回复"SFFAI135"获取本主题精选论文 01 推荐理由…

MICCAI2021论文合集

2021年的MICCAI论文合集来了!!! 在官网下完了以下合集: 百度网盘链接: 如果有人搞Alzheimer disease classification的可以一起交流!!! 链接2022.08.19更新: 链接&am…

我是如何从头写一篇顶级论文的

Datawhale干货 作者:重剑无锋知乎,剑桥大学,编辑:极市平台 原文丨https://zhuanlan.zhihu.com/p/538681254 极市导读 关于一篇顶会论文是如何产生的这件事—且看作者为你娓娓道来,如何从一形成routine的日常科研生活…

分享一个ai写论文的网站

场景: 直接输入需求,输入问题即可 链接 https://chatgpt.sbaliyun.com/

用计算机套路别人,套路计算器隐藏版

套路计算器隐藏版是款非常适合撩妹的神器,各种整蛊玩法,套路你的女朋友,操作简单,不需要root免费使用,轻松的哄女朋友开心。 套路计算器隐藏版特色 1.在这里都可以跟你的好友们设定任何的计算套路。 2.在使用的时候看起…

哈工大未来计算机院士,2017年中国高校新增工程院院士名单出炉,哈工大依然很强!...

原标题:2017年中国高校新增工程院院士名单出炉,哈工大依然很强! 院士是一个国家在科学技术方面的最高称号,不光在我们国家有,其他很多国家也有院士称号。而我国的院士一般都是指中国工程院院士和中国科学院院士&#x…

DetectGPT(斯坦福大学):利用概率曲率检测文本是否大模型生成

论文标题:《DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature》 论文链接:https://arxiv.org/abs/2301.11305 代码数据:https://ericmitchell.ai/detectgpt/ 作者通过分析超大模型生成文章与人类文章的…

淘宝API,商品详情的测试及使用

为了进行淘宝的API开发,首先我们需要做下面几件事情。 1)开发者注册一个账号, 2)然后为每个淘宝应用注册一个应用程序键(App Key) 。 3)下载淘宝API的SDK并掌握基本的API基础知识和调用,具体…

淘宝原数据商品详情API调用示例

以下是行业内了解到的一些情况,本帖只展示部分代码,需要更多API调试请移步注册API账号登录 - 跨境电商平台接口提供商 数据采集公司 数据接口定制服务 企业级数据服务商 { "item": { "apiStack": [ { …

淘宝API应用调用官方买家信息数据

公共请求参数: API请求工具 名称 类型 必须 描述 method String 是 API接口名称,例如:taobao.user.buyer.get app_key String 是 TOP分配给应用的AppKey,例如:12345678 session String 否 用户登录授权成功后,TOP…