论文笔记:面向实体的多模态对齐与融合网络假新闻检测

整理了2022TMM期刊 Entity-Oriented Multi-Modal Alignment and Fusion Network for Fake News Detection)论文的阅读笔记

  • 背景
  • 模型
    • 改进的动态路由算法
    • Cross-Modal Fusion
  • 实验

背景

  现有的假新闻方法对多模态特征进行各种跨模态交互和融合,在检测常见假新闻方面已经被证明是有效的。但是,多模态新闻的描述是围绕实体进行的,之前的方法对这一特性的关注较少,在需要以实体为中心的比较的假新闻检测方面表现不佳。基于此,本文探索了一种通过对齐和融合多模态实体来检测假新闻的新范式,并提出了面向实体的多模态对齐和融合网络(EMAF)。该工作采用以实体为中心的跨模态交互,可以保留语义完整性并捕获多模态实体的细节。
  作者认为,现有的假新闻检测方法大致可以分为粗粒度和细粒度两种,细粒度方法在词级和像素级(图2中的(a))进行跨模态交互,但是无法保持实体的语义完整性。粗粒度方法在句子级和图像级特征(图2中的(b))上进行跨模态交互,可能会忽略同一模态内对象之间的关系。本文提出了一种面向实体的跨模态交互方法,实现了粗粒度和细粒度方法之间的折衷。
在这里插入图片描述

模型

  EMAF由封装模块、跨模态对齐模块、跨模态融合模块和最终的分类器组成。具体来说,采用改进的动态路由算法(胶囊算法)设计了对齐模块,并引入了基于比较的融合模块,前者对重要实体进行对齐和捕获,后者对以实体为中心的特征进行比较和聚合。将聚合地特征送入最终的分类器中得到结果。
  设T和V分别表示原始文本句子和图像输入,TE、VE和AE分别表示文本实体、视觉实体和对齐实体的集合。实体集合的每一个元素都是指一个特定实体的表示。本文的视觉实体由预训练的Faster R-CNN提取,文本实体是怎么得到的没有说明。
  EMAF的输入由文本实体集 T E = { t e 1 , … , t e M } TE=\{te_1,…,te_M\} TE={te1,,teM}和可视化实体集 V E = { v e 1 , . . . , v e N } VE = \{ve_1,...,ve_N\} VE={ve1,...,veN}。包含视觉实体和文本实体的胶囊单元分别被指定为主胶囊和数字胶囊。对齐模块采用一种改进的动态路由算法,实现可视化实体与文本实体之间的跨模态交互,该过程生成对齐实体集 A E = { a e 1 , . . . , a e M } AE=\{ae_1,...,ae_M\} AE={ae1,...,aeM}
  为了捕获对齐实体和源文本实体之间的一致性和差异性,在跨模态融合模块中引入了Attend、Compare和Aggregate方法来执行二阶交互。收集与真实性相关的重要特征,并生成样本的固定大小表示。然后,分类器根据这个表示给出最终的预测。算法为:
在这里插入图片描述整个模型的结构:
在这里插入图片描述

改进的动态路由算法

  首先初始化 b i , j 1 b_{i,j}^1 bi,j1(这里的上标1和下面的k表示堆叠结构中的第k层),它用来测量 v e i ve_i vei t e j T te_j^T tejT的对齐程度: b i , j 1 = v e i ⋅ t e j T b_{i,j}^1=ve_i\cdot te_j^T bi,j1=veitejT  然后使用softmax对 b i , j k b_{i,j}^k bi,jk进行归一化,得到一个对齐的分布 c j k c_j^k cjk,并以类似于注意机制的方式对视觉实体进行加权和。这样,视觉实体被组装为第j个文本实体,并产生 s j k s_j^k sjk c j k = s o f t m a x ( [ b 1 , j k , . . . , b i , j k , . . . , b N , j 1 ] ) c_j^k=softmax([b_{1,j}^k, ...,b_{i,j}^k,...,b_{N,j}^1]) cjk=softmax([b1,jk,...,bi,jk,...,bN,j1]) s j k = ∑ i c i , j k v e i s_j^k=\sum_ic_{i,j}^kve_i sjk=ici,jkvei  接下来,为了测量当前第j个数字胶囊所代表的实体是否存在于 s j k s_j^k sjk中,使用了一个称为“压扁”的非线性激活函数。 v j k = ∣ ∣ s j k ∣ ∣ 2 1 + ∣ ∣ s j k ∣ ∣ 2 s j k ∣ ∣ s j k ∣ ∣ v_j^k=\frac{||s_j^k||^2}{1+||s_j^k||^2}\frac{s_j^k}{||s_j^k||} vjk=1+∣∣sjk2∣∣sjk2∣∣sjk∣∣sjk  在将对齐的视觉实体信息收集到 v j k v_j^k vjk后,通过一个门将对应的 v j k v_j^k vjk t e j K te_j^K tejK组合到一起,这个门把v向量的长度作为权重,更新相应文本实体的表示: G j k = ∣ ∣ v j k ∣ ∣ G_j^k=||v_j^k|| Gjk=∣∣vjk∣∣ t e j k + 1 = ( 1 − G j k ) ⋅ t e j k + G J k ⋅ v j k te_j^{k+1}=(1-G_j^k)\cdot te_j^k+G_J^k\cdot v_j^k tejk+1=(1Gjk)tejk+GJkvjk  这样,我们就得到了进行一轮更新后的文本实体表示,再把这个表示作为数字胶囊进入下一轮更新,这样,文本实体会与和这个实体相似度高的视觉实体相似度score增加,文章称之为”被接受“,而相似度低的视觉实体相似度score减少,称之为”被拒绝“。
  该过程在达到K次迭代后停止,并且从视觉实体派生的 T E K = [ t e 1 k , … , t e j k , … , t e M k ] TE^K = [te_1^k,…,te_j^k,…,te_M^k] TEK=[te1k,,tejk,,teMk]被认为是文本实体的对齐表示。
为了表示方便,将 T E K = [ t e 1 k , … , t e j k , … , t e M k ] TE^K = [te_1^k,…,te_j^k,…,te_M^k] TEK=[te1k,,tejk,,teMk]重新定义为 A E = [ a e 1 , … , a e j , … , a e M ] AE = [ae_1,…,ae_j,…,ae_M] AE=[ae1,,aej,,aeM]
在这里插入图片描述

Cross-Modal Fusion

  跨模态融合模块旨在捕获对齐实体与原始文本实体之间的一致性和差异性,并进一步提取验证样本真实性所需的特征。
  在上文中,我们得到了对齐后的文本实体TE与对齐实体AE之间建立了一一对应关系。但是本文提出,由于在对齐过程中没有考虑来自相同模态的实体之间的语义关系。以图3中的样本为例,“大象”与“岩石”的关系来源于“象形岩石”这句话。自然不能交付给对齐的实体。反过来,从图像中衍生出的“象”与“石”的关系,也无法传递给文本实体。为了弥补这一遗漏,引入了Attend组件,旨在从同一模态中追求实体之间的关系。
  对于来自TE的每个实体,将其与所有文本实体连接起来,以捕获其与其他文本实体的关系,然后利用多层感知器(MLP)将连接的结果映射到关系空间。最后,执行max-pooling来选择实体 t e i te_i tei的重要关系特征 t r i tr_i tri。最终,我们得到了TR代表TE, AR代表AE的关系表示: t r i = M a x p o o l i n g ( M L P ( [ t e i ; T E ] ) ) tr_i=Maxpooling(MLP([te_i;TE])) tri=Maxpooling(MLP([tei;TE])) a r i = M a x p o o l i n g ( M L P ( [ a e i ; A E ] ) ) ar_i=Maxpooling(MLP([ae_i;AE])) ari=Maxpooling(MLP([aei;AE]))  对于TE和AE,执行元素减法来捕获差异,此外还进行了元素点积来捕获相似性。将所有比较特征串联起来,分别在实体级和关系级得到EC和RC: e c i = [ a e i ; t e i ; a e i − t e i ; a e i ⋅ t e I ] ec_i=[ae_i;te_i;ae_i-te_i;ae_i\cdot te_I] eci=[aei;tei;aeitei;aeiteI] r c i = [ a r i ; t r i ; a r I − t r i ; a r I ⋅ t r i ] rci=[ar_i;tr_i;ar_I-tr_i;ar_I\cdot tr_i] rci=[ari;tri;arItri;arItri]  最后,在实体集EC和关系集RC上执行平均池化和最大池化策略,通过连接池化操作的结果获得用于标签预测的最终向量C,送入分类头进行预测: C = [ A v g ( E C ) ; M a x ( E C ) ; A v g ( R C ) ; M a x ( R C ) ] C=[Avg(EC);Max(EC);Avg(RC);Max(RC)] C=[Avg(EC);Max(EC);Avg(RC);Max(RC)]

实验

  本文的实验使用了Reddit、微博和Twitter三个数据集。
在这里插入图片描述  对比实验结果:在这里插入图片描述  在Reddit数据集上,本文的模型和之前模型的对比:在这里插入图片描述  消融实验:在这里插入图片描述
  可视化:在多层迭代中,数字胶囊单元(文本实体)和主胶囊(视觉实体)之间逐渐被对齐。在这里插入图片描述  检测结果的示例:在这里插入图片描述
  这篇文章并没有开源,我自己实现的效果与论文中相差很大,如果您也复现了这篇文章或是对这篇文章感兴趣,欢迎私信我一起讨论。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/304124.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Ollama在本地运行AI大模型gemma

1.下载: https://github.com/ollama/ollama/releases 2.配置环境变量 我的电脑-右键-属性-系统-高级系统设置-环境变量-【系统环境变量】新建 变量名:OLLAMA_MODELS (固定变量名) 变量值:E:\Ollama\Lib &#xff0…

Unity自定义icon

Unity自定义icon 1. 新建文件夹 OfficeFabricIconSet2. 新建Iconset3. 新建子文件夹Textures并添加icon图片4. 向iconset添加Quad Icons5. 最终效果 教程来源处: https://365xr.blog/build-your-own-button-icon-set-for-microsoft-hololens-2-apps-with-mrtk-using…

seo调优

SEO 网站地图:sitemap.xmlrobots.txtxxx.com/www.xxx.com 解析到服务器,xxx.com 301 到 www.xxx.comhttps百度站点管理标题描述关键词标签语义化内链外链死链链接html结尾友情链接前端架构 注意:已收录链接,禁止改变链接地址 ro…

Spring boot 入门 ---(一),2024年最新java进阶训练营

spring-snapshots http://repo.spring.io/snapshot spring-milestones http://repo.spring.io/milestone spring-boot-starter-parent是使用Spring Boot的一种不错的方式,但它 并不总是最合适的。有时你可能需要继承一个不同的父POM,或只是不喜欢我…

Linux网络基础 (三) —— Socket

文章目录 Socket 编程基本概念Socket背景Socket 为了解决什么问题 socketsockaddr结构sockaddrsockaddr_insockaddr 和 sockaddr_in 的关系sockaddr_un 示例代码 🎖 博主的CSDN主页:Ryan.Alaskan Malamute 📜 博主的代码仓库主页 [ Gitee ]&…

AMRT3D数字孪生引擎

产品概述 AMRT3D引擎是由眸瑞网络科技自主研发、拥有完全自主知识产权的一款全球首款轻量化3D图形引擎,引擎以核心的轻量化技术及AMRT轻量格式为支柱,专为数字孪生项目开发打造。 AMRT3D引擎提供一整套完善的数字孪生解决方案,在数据处理方…

three.js尝试渲染gbl模型成功!(三)

参照教程:https://cloud.tencent.com/developer/article/2276766?areaSource102001.5&traceId88k805RaN_gYngNdKvALJ (作者:九仞山) 通过最近两天查three.js入门教程了解到 这玩应支持包括 .obj、.gltf等类型的模型结构。 g…

国产低代码工具,轻松搞定数据迁移

在日常的业务系统升级或者数据维护过程中,数据迁移是各个企业用户不得不面临的问题,尤其是数据迁移过程中要保障数据完整性、统一性和及时性,同时也需要注意源数据中的数据质量问题,比如缺失、无效、错误等问题,需要在…

windows版本-idea中下载的java版本在哪

1、点击idea的file-projectStructure 进入: 通过电脑目录进入该目录 找到bin目录,copy该目录地址 copy下来之后设置到系统环境变量中

synchronized 锁升级过程

synchronized 锁升级过程 Java中的synchronized锁升级过程是JVM为了提高并发性能而引入的一种优化策略,它在JDK 1.6及更高版本中得到了显著的改进。以下是synchronized锁从无锁状态到偏向锁、轻量级锁直至重量级锁的详细升级过程: 无锁状态:…

QT学习day4

widget.h #define WIDGET_H #include <QWidget> #include <QTime>//时间类 #include <QTimerEvent>//定时器类 #include <QPushButton>//按钮类 #include <QTextToSpeech>//语音播报 QT_BEGIN_NAMESPACE namespace Ui { class Widget; } QT_E…

逆向案例十八——webpack逆向红人点集登录密码

网址链接&#xff1a;红人点集 密码登录&#xff0c;获取数据包&#xff1a; 发现pwd和sig两个加密参数&#xff0c;开始跟栈调试 点击第一个&#xff0c;在send处打上断点&#xff0c;再点击登录。 进入异步栈&#xff0c;r.requests 释放之前的断点&#xff0c;打上断点 &a…

【linux】基础IO(四)

在上一篇基础IO中我们主要讲述了文件再磁盘中的存储&#xff0c;当然我们说的也都只是预备知识&#xff0c;为这一篇的文件系统进行铺垫。 目录 搭文件系统的架子&#xff1a;填补细节&#xff1a;inode&#xff1a;datablock[]: 更上层的理解&#xff1a; 搭文件系统的架子&a…

实验1 eNSP安装与使用

实验1 eNSP安装与使用 一、 原理描述二、 实验目的三、 实验内容四、 实验步骤1.下载并安装eNSP2.eNSP软件界面3.搭建并运行网络拓扑4. Wireshark 捕获分组并分析 一、 原理描述 eNSP&#xff08;Enterprise Network Simulation Platform&#xff09;是由华为提供的免费网络模…

【PDF-XSS攻击】Java项目-上传文件-解决PDF文件XSS攻击

文章目录 背景解决pdfbox依赖控制器代码PdfUtils工具类 验证最后源码参考 背景 上传xss-pdf造成存储型xss因为在浏览器直接预览的PDF&#xff0c;而不是预览&#xff0c;所以安全部门认为会有XSS漏洞 解决 安全部门修复建议 1、根据白名单的标签和属性对数据进行过滤&#…

H.265网页无插件播放EasyPlayer.js流媒体播放器常见问题及解答

EasyPlayer属于一款高效、精炼、稳定且免费的流媒体播放器&#xff0c;可支持多种流媒体协议播放&#xff0c;无须安装任何插件&#xff0c;起播快、延迟低、兼容性强&#xff0c;使用非常便捷。 今天我们来汇总下用户常见的几个问题及解答。 1、EasyPlayer.js播放多路H.265视…

【鸿蒙开发】组件状态管理@Prop,@Link,@Provide,@Consume,@Observed,@ObjectLink

1. Prop 父子单向同步 概述 Prop装饰的变量和父组件建立单向的同步关系&#xff1a; Prop变量允许在本地修改&#xff0c;但修改后的变化不会同步回父组件。当父组件中的数据源更改时&#xff0c;与之相关的Prop装饰的变量都会自动更新。如果子组件已经在本地修改了Prop装饰…

竞赛升温,量子革命待发

人工智能已经吸引了全球企业巨头和政界领袖的广泛关注。同时&#xff0c;一场激烈的全球竞赛正在展开&#xff0c;目标是开发被许多专家视为下一个领域革命性技术的量子计算。 量子计算机利用量子物理学的原理&#xff0c;有潜力推动包括药物研究、股票市场分析以及数据加密在内…

AI论文速读 | TF-LLM:基于大语言模型可解释性的交通预测

论文标题&#xff1a; Explainable Traffic Flow Prediction with Large Language Models 作者&#xff1a;Xusen Guo, Qiming Zhang, Mingxing Peng, Meixin Zhu(朱美新)*, Hao (Frank)Yang(杨昊) 机构&#xff1a;香港科技大学&#xff08;广州&#xff09;&#xff0c;约翰…

【GameFi】链游 | E4C | 堕落竞技场FallenArena

官网&#xff1a;https://www.ambrus.studio/ 游戏下载&#xff1a;https://www.ambrus.studio/game/fallenArena Fallen Arena是一款15人对战游戏&#xff0c;包含单人对战模式和3人队伍对战模式。玩家可以通過收集地图上散落的宝石或消灭对手来获得积分。得分最高的玩家或队伍…