CFPRF:一种用于音频时间伪造检测和定位的框架

关键词:音频伪造检测、时间伪造定位、差异特征感知学习

     最近,一种新型的音频部分伪造形式对音频取证提出了挑战,这要求采取先进的对策来检测长时间音频中的微妙伪造操作。然而,现有的对策仍然服务于分类目的,未能对部分伪造片段的开始和结束时间戳进行有意义的分析。

现有对策面临的挑战:

  • 分类限制:当前的音频伪造检测(PFD)解决方案仍然以分类为目标,即从预测整个语音到帧级结果的范围。然而,在修改后的音频中提供时间伪造区域可以帮助用户更好地理解音频伪造内容的分析结果,这更符合音频取证的实际需求和应用。
  • 小伪造片段挑战:如果恶意用户具备语音学知识,他们可以通过操纵元音甚至小于单词级别的辅音来改变原始语义。时间伪造定位(TFL)网络的目标是预测特定的伪造区域,而在长时间音频中定位由单个帧或几个连续帧组成的小伪造片段可能具有挑战性。
  • 多个伪造片段挑战:恶意用户可能不仅仅操纵音频中的一个片段,而是故意在多个片段中使用伪造。这种挑战导致随着伪造片段数量的增加,定位性能逐渐减弱。过渡边界可以提供有价值的线索来增强多个伪造片段的检测,因为它指示了诸如语音不一致性和环境噪声不一致性之类的伪影。

新型部分音频伪造及其对策的示意图

为了应对这些挑战,本文引入了一种新颖的两阶段框架,称为粗到细的提议细化框架(CFPRF),用于音频时间伪造检测和定位(TFDL)。与现有的音频PFD方法不同,作者利用第一阶段的帧级检测网络(FDN)来学习鲁棒的表示,以更好地指示大致的伪造区域,并在第二阶段使用提议细化网络(PRN)来产生细粒度的提议。

1 CFPRF框架

CFPRF是一个新颖的从粗到细的提议细化框架,它结合了一个帧级检测网络(FDN)和一个提议细化网络(PRN),用于音频时间伪造的检测和定位。CFPRF的核心思想是通过强迫模型感知不同帧之间微妙的差异,并捕获多个转换边界的上下文信息,来挖掘时间不一致线索。

CFPRF框架

1.1 阶段一:帧级检测网络 (FDN)

学习鲁棒的区分特征,更好地指示伪造区域。

  • 差异感知特征学习 (DAFL) 模块: 利用对比学习,通过双注意力层提取频谱和通道信息,并扩大不同帧之间的细微差异,从而更好地区分伪造帧和真实帧。
  • 边界感知特征增强 (BAFE) 模块: 通过 MLP 和自注意力机制学习边界特征,并与时间特征进行交叉注意力交互,增强对多个伪造段落的检测能力。
  • 输出: 帧级伪造概率得分和特征向量。

1.2 阶段二:提议细化网络 (PRN)

利用 FDN 的输出,产生更精细的伪造段定位提议。

  • 粗粒度提议生成: 根据帧级伪造概率得分,将连续的伪造帧合并为粗粒度提议区域。
  • 细粒度提议生成: 利用提议区域特征,通过验证头和回归头预测置信分数和回归偏移量,对粗粒度提议进行细化。
  • 输出: 精细的伪造段定位提议,包括起始时间戳、持续时间长度和置信分数。

2 实验

2.1 数据集

  • LAV-DF: 一个多模态数据集,主要用于音频和视频篡改的检测与定位。包含语音替换和删除操作的部分伪造音频数据集,每个音频片段包含一个或多个伪造区域。
  • ASVS2019PS: 包含语音替换、删除和插入操作的部分伪造音频数据集,具有更多的小规模伪造区域,更具挑战性。
  • HAD: 包含语音替换和删除操作的部分伪造音频数据集,每个音频片段包含一个伪造区域。

2.2 对比方法

  • PFD 方法: PSDL 和 IFBDN,用于评估 CFPRF 的 PFD 性能。
  • TFL 方法: BA-TFD、BA-TFD+ 和 UMMAF,用于评估 CFPRF 的 TFL 性能。
  • PRN 集成: 将 PRN 与 PSDL 和 IFBDN 集成,以评估 PRN 的有效性。

2.3 评价指标

  • PFD: 等误差率 (EER)、曲线下面积 (AUC)、准确率 (Pre)、召回率 (Rec) 和 F1 分数。
  • TFL: 平均精度 (AP) 在不同 TIoU 阈值下,不同平均提议数量 (AN) 下的平均召回率 (AR),以及不同 TIoU 阈值下的平均 AP (mAP)。

2.4 实验结果

  • PFD 性能: CFPRF 在三个数据集上都取得了最佳的 PFD 性能,EER 和 F1 分数均优于其他方法。
  • TFL 性能: CFPRF 在三个数据集上都取得了最佳的 TFL 性能,mAP 和 AR@20 均优于其他方法。
  • PRN 集成: PRN 与 PSDL 和 IFBDN 集成后,在 ASVS2019PS 数据集上取得了显著的性能提升,证明了 PRN 的有效性。
  • 消融实验: 消融实验表明,FDN 和 PRN 中的各个模块都对性能有重要贡献,并且不同的损失函数可以有效地指导特征学习。

主要参考:

Junyan Wu, Wei Lu,et al. Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization.arXiv preprint arXiv:2407.16554 2024

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/383113.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Binius-based zkVM:为Polygon AggLayer开发、FPGA加速的zkVM

1. 引言 近日,ZK硬件加速巨头Irreducible和Polygon团队宣布联合开发生产级的Binius-based zkVM,用于助力Polygon AggLayer,实现具有低开销、硬件加速的binary proofs。 Irreducible(曾用名为Ulvetanna)团队 Benjamin …

Hyper-V 安装 CentOS 8.5

前言 Hyper-V安装文档:在 Windows 10 上安装 Hyper-VCentOS 系统下载:CentOS 国内镜像源 8.5.2111作者:易墨发布时间:2023.10.01原文地址:https://www.cnblogs.com/morang/p/devops-hyperv-centos-install.html使用命令安装 以管理员身份运行 PowerShell 命令: Enable-…

Three.js投射光线实现三维物体交互

<template><div id"webgl"></div> </template><script setup> import * as THREE from three //导入轨道控制器 import { OrbitControls } from three/examples/jsm/controls/OrbitControls // 导入 dat.gui import { GUI } from thre…

Blender材质-PBR与纹理材质

1.PBR PBR:Physically Based Rendering 基于物理的渲染 BRDF:Bidirection Reflectance Distribution Function 双向散射分散函数 材质着色操作如下图&#xff1a; 2.纹理材质 左上角&#xff1a;编辑器类型中选择&#xff0c;着色器编辑器 新建着色器 -> 新建纹理 -> 新…

数学建模比赛介绍与写作建议

0 小序 本文的写作起因是导师要求我给打算参加相关竞赛的师弟们做一次讲座和汇报。我梳理了一个ppt提纲&#xff0c;并经过整理&#xff0c;因此有了这篇文章。 我打算从数学建模论文写作格式和写作技巧入手&#xff0c;接着介绍数学建模常用的数学模型&#xff0c;最后提出一…

python-NLP:1中文分词

文章目录 规则分词正向最大匹配法逆向最大匹配法双向最大匹配法 统计分词语言模型HMM模型 jieba分词分词关键词提取词性标注 规则分词 基于规则的分词是一种机械分词方法&#xff0c;主要是通过维护词典&#xff0c;在切分语句时&#xff0c;将语句的每个字符串与词表中的词进行…

很酷的仿真翻页书HTML源码,书本页面是加载的图片,基于JQuery实现的翻页特效,结合一些js插件,看起来很酷,在实现在线翻书项目。

仿真翻页书HTML源码https://www.bootstrapmb.com/item/14742 创建一个仿真的翻页书效果在HTML和CSS中可以通过多种方式实现&#xff0c;但通常这也会涉及到JavaScript&#xff08;或jQuery&#xff09;来处理交互和动画。以下是一个简单的示例&#xff0c;展示如何使用HTML、…

【GoLang】Golang 快速入门(第一篇)

目录 1.简介&#xff1a; 2.设计初衷&#xff1a; 3.Go语言的 特点 4.应用领域: 5.用go语言的公司&#xff1a; 6. 开发工具介绍以及环境搭建 1.工具介绍: 2.VSCode的安装: 3.安装过程&#xff1a; 4.Windows下搭建Go开发环境--安装和配置SDK 1.搭建Go开发环境 - 安装…

SQUID - 形状条件下的基于分子片段的3D分子生成等变模型 评测

SQUID 是一个形状条件下基于片段的3D分子生成模型&#xff0c;给一个3D参考分子&#xff0c;SQUID 可以根据参考分子的形状&#xff0c;基于片段库&#xff0c;生成与参考分子形状非常相似的分子。 SQUID 模型来自于 ICLR 2023 文章&#xff08;2022年10月6日提交&#xff09;&…

【iOS】isMemberOfClassisKindOfClass

目录 前言class方法isMemberOfClass和isKindOfClass实例方法分析类方法分析 实例验证总结 前言 认识这两个方法之前&#xff0c;首先要了解isa指向流程和继承链&#xff08;【iOS】类对象的结构分析&#xff09;关系&#xff0c;以便理解得更透彻 上经典图&#xff1a; 要注意…

动态代理更改Java方法的返回参数(可用于优化feign调用后R对象的统一处理)

动态代理更改Java方法的返回参数&#xff08;可用于优化feign调用后R对象的统一处理&#xff09; 需求原始解决方案优化后方案1.首先创建AfterInterface.java2.创建InvocationHandler处理代理方法3. 调用 实际运行场景拓展 需求 某些场景&#xff0c;调用别人的方法&#xff0…

深入浅出WebRTC—DelayBasedBwe

WebRTC 中的带宽估计是其拥塞控制机制的核心组成部分&#xff0c;基于延迟的带宽估计是其中的一种策略&#xff0c;它主要基于延迟变化推断出可用的网络带宽。 1. 总体架构 1.1. 静态结构 1&#xff09;DelayBasedBwe 受 GoogCcNetworkController 控制&#xff0c;接收其输入…

贪心算法(算法篇)

算法之贪心算法 贪心算法 概念&#xff1a; 贪心算法是一种思想&#xff0c;并不是一种算法&#xff0c;贪心算法是分阶段地工作&#xff0c;在每一个阶段&#xff0c;可以认为所作决定是好的&#xff0c;而不考虑将来地后果。算法的每个阶段总是选择当前阶段最优&#xff0…

Kafka Producer之数据重复和乱序问题

文章目录 1. 数据重复2. 数据乱序 为了可靠性&#xff0c;Kafka有消息重试机制&#xff0c;但是同时也带来了2大问题 1. 数据重复 消息发送到broker后&#xff0c;broker记录消息数据到log中&#xff0c;但是由于网络问题&#xff0c;producer没有收到acks&#xff0c;于是再次…

Axure设计之轮播图(动态面板+中继器)

轮播图&#xff08;Carousel&#xff09;是一种网页或应用界面中常见的组件&#xff0c;用于展示一系列的图片或内容&#xff0c;通常通过自动播放或用户交互&#xff08;如点击箭头按钮&#xff09;来切换展示不同的内容。轮播图能够吸引用户的注意力&#xff0c;有效展示重要…

新手小白的pytorch学习第十一弹-----Computer Vision创建基础模型使用FashionMNIST

目录 PyTorch Computer Vision0 PyTorch 中 Computer vision 的库1 获得一个数据集1.1 查看数据的输入和输出形状1.2 可视化数据 2 准备 DataLoader3 Model 0: 创建一个 baseline model3.1 设置损失函数、优化器和评估指标3.2 创建一个函数来给我们的实验计时3.3 在批量数据集上…

萝卜快跑:自动驾驶的先锋与挑战

萝卜快跑&#xff1a;自动驾驶的先锋与挑战 近段时间&#xff0c;由萝卜快跑引发的自动驾驶事件如火如荼&#xff0c;成为科技领域的热门话题。萝卜快跑作为自动驾驶领域的重要参与者&#xff0c;其最新事件引发了广泛的关注和讨论。 萝卜快跑是百度推出的自动驾驶出行服务平台…

20240724-然后用idea创建一个Java项目/配置maven环境/本地仓储配置

1.创建一个java项目 &#xff08;1&#xff09;点击页面的create project&#xff0c;然后next &#xff08;2&#xff09;不勾选&#xff0c;继续next &#xff08;3&#xff09;选择新项目名称&#xff0c;新项目路径&#xff0c;然后Finsh&#xff0c;在新打开的页面选择…

Hadoop、Hive、HBase、数据集成、Scala阶段测试

姓名&#xff1a; 总分&#xff1a;Hadoop、Hive、HBase、数据集成、Scala阶段测试 一、选择题&#xff08;共20道&#xff0c;每道0.5分&#xff09; 1、下面哪个程序负责HDFS数据存储&#xff08; C &#xff09; A. NameNode B. Jobtracher C. DataNode D. Sec…

鸿蒙界面开发

界面开发 //构建 → 界面 build() {//行Row(){//列Column(){//文本 函数名(参数) 对象.方法名&#xff08;参数&#xff09; 枚举名.变量名Text(this.message).fontSize(40)//设置文本大小.fontWeight(FontWeight.Bold)//设置文本粗细.fontColor(#ff2152)//设置文本颜色}.widt…