Learning Rich Features for Image Manipulation Detection阅读笔记

文章目录

  • Abstract
    • 3.3. 双线性池

Abstract

图像篡改检测与传统的语义目标检测(semantic object detection)不同,因为它更关注篡改伪影(tampering artifacts)而不是图像内容,这表明需要学习更丰富的特征。我们提出了一个两流 Faster R-CNN network,并对其进行端到端训练,以检测给定被操纵图像的篡改区域。其中一个流是 RGB 流,其目的是从RGB图像输入中提取特征,以查找 tampering artifacts,如强烈的对比度差异、不自然的篡改边界等。另一个是噪声流,利用从隐写分析富模型滤波层(steganalysis rich model filter layer)提取的噪声特征来发现真实区域和篡改区域之间的噪声不一致。然后,我们通过双线性池化层融合来自两个流的特征,以进一步合并这两种模态的空间共现(incorporate spatial co-occurrence of these two modalities)。在四个标准的图像处理数据集上的实验表明,所提出的双流框架优于每个单独的流,并且与对缩放和压缩具有鲁棒性,也实现了最先进的性能。


在这里插入图片描述

3.3. 双线性池

最后,我们将RGB流与噪声流结合起来进行操作检测。在各种融合方法中,我们对来自两个流的特征应用了双线性池化(bilinear pooling)。双线性池化[23],首次提出用于细粒度分类,在保留空间信息(spatial information)的同时,结合双流CNN网络,以提高检测置信度。我们的双线性池化层的输出为 x = f R G B T f N x=f_{R G B}^{T} f_{N} x=fRGBTfN,其中 f R G B f_{R G B} fRGB 为RGB流的 Rol 特征, f N f_{N} fN 为噪声流的 Rol 特征。和池化在分类之前对空间特征进行挤压。然后我们在前向全连接层之前应用有符号平方根 ( x ← sign ⁡ ( x ) ∣ x ∣ ) (x \leftarrow \operatorname{sign}(x) \sqrt{|x|}) (xsign(x)x ) L 2 L_2 L2 归一化。


为了在不降低性能的情况下节省内存和加速训练,我们使用[17]中提出的紧凑双线性池化(compact bilinear pooling)。

在完全连接层和softmax层之后,我们得到了 RoI 区域的预测类,如图2所示。我们使用交叉熵损失进行操纵分类,使用平滑 L 1 L_1 L1 损失进行边界框回归。总损失函数为:

L total  = L R P N + L tamper  ( f R G B , f N ) + L b b o x ( f R G B ) , (2) L_{\text {total }}=L_{R P N}+L_{\text {tamper }}\left(f_{R G B}, f_{N}\right)+L_{b b o x}\left(f_{R G B}\right),\tag{2} Ltotal =LRPN+Ltamper (fRGB,fN)+Lbbox(fRGB),(2)

其中Ltotal表示总损失。LRPN为RPN网络中的RPN损耗。Ltamper表示最终的交叉熵分类损失,它基于RGB和噪声流的双线性池化特征。Lbbox表示最终的边界框回归损失。fRGB和fN是来自RGB和噪声流的RoI特征。所有项的总和产生总损失函数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/82119.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微服务架构基础--第3章Spring Boot核心功能讲解

第3章Spring Boot核心功能讲解 一.预习笔记 1.使用maven创建SpringBoot项目 1-1:创建一个maven项目 1-2:在pom文件中导入依赖 1-3:编写启动类(注意启动类的位置) 1-4:编写测试类 1-5:运行SpringBoot启动类 2.了解p…

JPA实现存储实体类型信息

本文已收录于专栏 《Java》 目录 背景介绍概念说明DiscriminatorValue 注解:DiscriminatorColumn 注解:Inheritance(strategy InheritanceType.SINGLE_TABLE) 注解: 实现方式父类子类执行效果 总结提升 背景介绍 在我们项目开发的过程中经常…

大模型AI人才培养研习会,上海、武汉站同期招募!

伴随预训练大语言模型技术引发的产业变革,市场对AI人才需求也同样发生着深刻变化,教育迎来了新的机遇与挑战。由中国自动化学会主办,百度公司联合知名高校承办的大模型AI人才培养研习会,首场将于8月19日在武汉、上海双城同期举办&…

flutter-GridView使用

先看效果 代码实现 import package:app/common/util/k_log_util.dart; import package:app/gen/assets.gen.dart; import package:app/pages/widget/top_appbar.dart; import package:flutter/cupertino.dart; import package:flutter/material.dart; import package:flutter_…

iOS 实现图片高斯模糊效果

效果图 用到了 UIVisualEffectView 实现代码 - (UIVisualEffectView *)bgEffectView{if(!_bgEffectView){UIBlurEffect *blur [UIBlurEffect effectWithStyle:UIBlurEffectStyleLight];_bgEffectView [[UIVisualEffectView alloc] initWithEffect:blur];}return _bgEffect…

吃瓜教程-Task05

目录 支持向量机 间隔与支持向量 SVM基本型 对偶问题 kkt条件 例子 对偶问题 例子 对偶问题原理解释 软间隔与正则化 替代损失函数 支持向量回归 例子 支持向量机 间隔与支持向量 在样本空间中,划分超平面可通过如下线性方程来描述: 样本空间中任意点x到…

在软件测试中,如何有效地跟踪和管理缺陷?

在软件测试中,跟踪和管理缺陷是非常重要的,因为这有助于确保所有问题得到妥善处理,避免在产品发布后出现问题。以下是跟踪和管理缺陷的一些有效方法: 1.创建缺陷报告:当发现一个缺陷时,应该立即创建一个缺…

无涯教程-Perl - binmode函数

描述 此函数设置在区分两者的操作系统上以二进制形式读取和写入FILEHANDLE的格式。非二进制文件的CR LF序列在输入时转换为LF,在LF时在输出时转换为CR LF。这对于使用两个字符分隔文本文件中的行的操作系统(MS-DOS)至关重要,但对使用单个字符的操作系统(Unix,Mac OS,QNX)没有影…

《合成孔径雷达成像算法与实现》Figure3.4

代码对补零信号与未补零信号都进行了实现,补零信号更加贴近书中图3.4的样子: clc clear all close all%参数设置 TBP 100; %时间带宽积 T 10e-6; %脉冲持续时间 alpha_os [1.4,1.2,1.0,0…

电脑开不了机如何解锁BitLocker硬盘锁

事情从这里说起,不想看直接跳过 早上闲着无聊,闲着没事干,将win11的用户名称改成了含有中文字符的用户名,然后恐怖的事情发生了,蓝屏了… 然后就是蓝屏收集错误信息,重启,蓝屏收集错误信息&…

可靠传输概述——停止-等待协议

基本概念: 使用差错检测技术(例如循环冗余校验CRC),接收方的数据链路层就可检测出帧在传输过程中是否出现了误码。 此时有: 不可靠传输服务:仅仅丢弃有误码的帧,其他什么也不做 可靠传输服务&a…

IDEA常用插件介绍

1.CodeGlance(CodeGlance Pro) 安装后,重新启动编译器即可。 CodeGlance是一款非常好用的代码地图插件,可以在代码编辑区的右侧生成一个竖向可拖动的代码缩略区,可以快速定位代码的同时,并且提供放大镜功能…

JVM 学习—— 类加载机制

前言 在上一篇文章中,荔枝梳理了有关Java中JVM体系架构的相关知识,其中涉及到的有关Java类加载机制的相关知识并没有过多描述。那么在这篇文章中,荔枝会详细梳理一下有关JVM的类加载机制和双亲委派模型的知识,希望能够帮助到有需要…

Protues如何安装下载使用:STM32利用Protues进行仿真

文章目录: 一:Proteus仿真的使用步骤 第一步:Proteus新建项目 第二步:Proteus设计电路图(选取元器件、摆放元器件、编辑元器件属性、原理图布线) 第三步:程序代码编写 第四步:…

Visual Studio 2022安装

Visual Studio下载网址

Netty 4.1.95.Final 正式发布,Java 网络应用框架

导读Netty 4.1.95 稳定版已发布。Netty 是一个异步事件驱动的网络应用框架,主要用于可维护的高性能协议服务器和客户端的快速开发。 此版本主要是修复错误,同时添加了一些新特性: 添加资源泄漏侦听器 (resource leak listener) (#13466)减少…

【云原生•监控】基于Prometheus实现自定义指标弹性伸缩(HPA)

【云原生•监控】基于Prometheus实现自定义指标弹性伸缩(HPA) 什么是弹性伸缩 「Autoscaling即弹性伸缩,是Kubernetes中的一种非常核心的功能,它可以根据给定的指标(例如 CPU 或内存)自动缩放Pod副本,从而可以更好地管…

应用在多媒体手机中的低功率立体声编解码器

多媒体手机一般是指可以录制或播放视频的手机。多媒体的定义是多种媒体的综合,一般是图像、文字、声音等多种结合,所以多媒体手机是可以处理和使用图像文字声音相结合的移动设备。目前流行的多媒体概念,主要是指文字、图形、图像、声音等多种…

一文搞定接口幂等性架构设计方案

幂等性介绍 现如今很多系统都会基于分布式或微服务思想完成对系统的架构设计。那么在这一个系统中,就会存在若干个微服务,而且服务间也会产生相互通信调用。那么既然产生了服务调用,就必然会存在服务调用延迟或失败的问题。当出现这种问题&a…

STM32 低功耗-睡眠模式

STM32 睡眠模式 文章目录 STM32 睡眠模式第1章 低功耗模式简介第2章 睡眠模式简介2.1 进入睡眠模式2.1 退出睡眠模式 第3章 睡眠模式代码示例总结 第1章 低功耗模式简介 在 STM32 的正常工作中,具有四种工作模式:运行、睡眠、停止和待机模式。 在系统或…