轻量化特征融合 | 一种基于增强层间特征相关性的轻量级特征融合网络 | 北理工新作

论文题目:A Lightweight Fusion Strategy With Enhanced Interlayer Feature Correlation for Small Object Detection

论文链接:https://ieeexplore.ieee.org/abstract/document/10671587

giuhub:https://github.com/nuliweixiao/EFC

关键词:特征融合、轻量级、小目标检测

摘要:由于低分辨率和背景混合,检测无人机图像中的小物体具有挑战性,导致特征信息有限。多尺度特征融合可以通过获取不同尺度上的信息来增强检测能力,但传统的方法存在不足。简单的连接或加法运算不能充分利用多尺度融合的优点,导致特征之间的相关性不足。这一不足阻碍了对小物体的检测,特别是在复杂背景和人口稠密地区。为了解决这一问题并有效地利用有限的计算资源,提出了一种基于增强层间特征相关性(EFC)的轻量级融合策略,以取代传统的特征金字塔网络(FPN)中的特征融合策略。特征金字塔中不同图层的语义表达不一致。在EFC中,分组的特征聚焦单元(GFF)通过聚焦不同特征的上下文信息来增强各层的特征相关性。多级特征重构模块(MFR)对金字塔中各层的强弱信息进行有效的重构和变换,减少冗余特征融合,保留更多的小目标信息。值得注意的是,所提出的方法是即插即用的,并且可以广泛地应用于各种基础网络。

研究背景:

无人机图像中小目标检测的挑战:一方面,无人机图像具有分辨率高、背景噪声明显的特点,会使目标物体模糊,检测难度加大。特别是小物体检测,由于小物体的分辨率低,使得它们更容易受到噪声的影响,导致有效信息有限。另一方面,无人机的硬件限制要求在这些资源限制内提高探测准确性。

多尺度特征融合的重要性: 通过增强网络对小目标的感知能力,多尺度特征融合可以提高检测精度。然而,传统的特征金字塔网络(FPN)中的简单拼接或加法操作未能充分利用多尺度融合的优势,导致特征之间的相关性不足。

方法不足:

在卷积神经网络(CNN)特征提取过程中,小目标容易出现特征消失。为了解决这个问题,多尺度特征融合通过丰富其特征表示来增强网络感知小目标的能力。该方法捕获各种尺度的目标信息,并提供高分辨率的特征图,这对于精确定位和识别至关重要。(多尺度的重要性

特征金字塔网络(FPN)[6]是一种广泛采用的模型,它通过集成骨干网络中的相邻层来生成金字塔式多尺度特征。这种融合将深层抽象语义特征与浅层高分辨率特征相结合,从而增强了不同尺度的特征表达。然而,FPN中的传统融合方法,例如简单的连接或加法运算,没有充分利用多尺度融合的优点。仅通过堆叠和通道融合对低分辨率特征进行上采样并与相邻层融合,而没有充分考虑它们的相关性。这种疏忽限制了每个层相关特征的利用,从而削弱了多尺度信息的表示。(不同层的交互

在特征融合阶段,融合信息通过3 × 3卷积层发送到探测头结构。在深层利用大的内核卷积通常会产生冗余信息,浪费计算资源。通过大的核卷积会导致浅层特征的语义偏差,使小目标特征信息更加抽象,难以与其空间位置匹配。(资源问题

本文贡献:

GFF以获得全局信息并增强融合特征的相关性。该过程主要包括空间聚焦、特征分组与融合、空间映射归一化等。这解决了传统融合策略中特征相关性和匹配性较差的问题,提供了更丰富的上下文信息,有助于模型更准确地定位小目标。

MFR分离特征间的强弱信息,指导特征间的转换,实现高层次的特征聚合。通过重构特征,减少了浅层特征和深层特征结合时产生的语义偏差。该方法旨在减少融合和变换引入的特征冗余,最小化小对象特征信息在深度网络中的丢失,增强小对象的表示能力。

创新点

EFC由两个主要部分组成:GFF和MFR。


GFF增强了相邻特征之间的相关性,并关注关键信息。

MFR将强空间信息和弱空间信息分开,利用轻量级卷积模块实现精确的特征转换。该方法减少了无关信息的提取,同时保留了深度网络中小对象的关键细节。


1、 Grouped Feature Focus Unit (GFF) 用于增强特征相关性,它通过关注不同特征之间的空间上下文信息来提高特征的语义表示。GFF 实现过程:

  1. 空间聚焦:首先,GFF 通过使用线性插值对低分辨率特征进行上采样,然后 1×1 卷积操作来确保特征图的通道数保持一致,然后将低分辨率的特征图与高分辨率的特征图进行元素级相加,得到粗略的特征图。接着,使用 1×1 卷积将特征图压缩到单个通道,以聚合空间信息,并通过 Sigmoid 激活函数生成空间聚焦权重。

  2. 特征分组与融合:将空间聚焦后的特征图沿通道维度分成多个组,对每个组内的特征进行交互操作。具体来说,使用卷积模块对每个组内的相邻通道特征进行细化,以生成捕捉通道间特征相关性的一个注意力掩码,该掩码捕获了不同通道间的特征相关性。然后将这个掩码应用于细化后的特征,最后将各组的特征连接起来,形成聚合且高度相关的相邻特征。

  3. 空间映射归一化:最后,我们将分组聚合特征嵌入到具有多层原始特征融合(MFF)的归一化层中。我们使用其平均值和标准差对特征进行归一化,从而从较小的目标中纳入更多的空间位置信息。通过MFF-GN,我们获得了特征相关性强、空间信息丰富的特征。

2. Multilevel Feature Reconstruction Module (MFR) 用于特征重建和转换,旨在减少特征融合过程中产生的冗余特征,同时需要最少的计算资源来变换较弱的特征,并保留更多关于小目标的信息。(为了减少不相关特征的融合和提取,最大限度地减少深度网络中目标信息的丢失)MFR实现过程

  1. 特征分离:首先,MFR 通过上采样、卷积和逐元素加法等操从不同阶段的特征图中提取强特征和弱特征,接下来,应用平均池化和sigmoid函数来生成每个通道的信息权重,作为特征权重阈值Tc。不同特征分别通过批量归一化(BN)进行处理,并由sigmoid函数激活,在每个空间位置生成唯一的权重信息ωi ,这表明不同特征图的重要性。接下来,将来自不同阶段的权重信息ωi和ωi-1与特征权重阈值Tc进行比较,以获得捕获空间信息强度的注意力图。然后,分别对不同层的强特征和弱特征进行聚合,得到增强特征和弱特征

  2. 特征转换:对于强特征,MFR 应用 1×1 卷积来生成包含更多详细信息的特征图UP。对于弱特征,MFR 利用设计的 Feature Transformation Unit (FTU) 来生成具有丰富语义信息的特征图,同时使用较少的计算资源。FTU 通过深度可分离卷积来实现,这种卷积操作降低了计算和参数开销。在深度可分离卷积运算之后,我们执行加权映射以增强通道之间的信息流。加权特征α通过自适应平均池化和卷积层进行处理。

  3. 级联融合:最后,MFR 将通过特征转换单元处理的特征与显示更多详细信息的特征图合并,生成最终的特征图。这个特征图包含了详细信息和跨通道信息交换。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/489171.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue2+element-ui实现多行行内表格编辑

效果图展示 当在表格中点击编辑按钮时:点击的行变成文本框且数据回显可以点击确定按钮修改数据或者取消修改回退数据: 具体实现步骤 1. 行数据定义编辑标记 行数据定义编辑标记 当在组件中获取到用于表格展示数据的方法中,针对每一行数据添加一个编辑标记 this.list.f…

docker简单私有仓库的创建

1:下载Registry镜像 导入镜像到本地中 [rootlocalhost ~]# docker load -i registry.tag.gz 进行检查 2:开启Registry registry开启的端口号为5000 [rootlocalhost ~]# docker run -d -p 5000:5000 --restartalways registry [rootlocalhost ~]# dock…

使用 GD32F470ZGT6,手写 I2C 的实现

我的代码:https://gitee.com/a1422749310/gd32_-official_-code I2C 具体代码位置:https://gitee.com/a1422749310/gd32_-official_-code/blob/master/Hardware/i2c/i2c.c 黑马 - I2C原理 官方 - IIC 协议介绍 个人学习过程中的理解,有错误&…

VSCode,Anaconda,JupyterNotebook

文章目录 一. 下载VSCode并安装二. 下载Anaconda并安装1. anaconda介绍2. Anaconda的包管理功能3. Anaconda的虚拟环境管理4.Jupyter Notebook5. Jupyter Notebook使用简介6. Jupyter Notebook快捷键7.Jupyter notebook的功能扩展8. Jupyter notebook和Jupyter lab的区别 三. V…

【安全研究】某黑产网站后台滲透与逆向分析

文章目录 x01. 前言x02. 分析 【🏠作者主页】:吴秋霖 【💼作者介绍】:擅长爬虫与JS加密逆向分析!Python领域优质创作者、CSDN博客专家、阿里云博客专家、华为云享专家。一路走来长期坚守并致力于Python与爬虫领域研究与…

力扣 343. 整数拆分 (JAVA 记忆化搜索->动态规划)

给定一个正整数 n ,将其拆分为 k 个 正整数 的和( k > 2 ),并使这些整数的乘积最大化。 返回 你可以获得的最大乘积 。 示例 1: 输入: n 2 输出: 1 解释: 2 1 1, 1 1 1。 示例 2: 输入: n 10 输出: 36 解释: 10 3 …

一次tomcat实战jvm线上问题定位排查和解决

问题分析: 问题来源是客户通过闲鱼找到了我这边进行问题的排查,给我发了一个报错日志,让我帮忙分析。 首先他的项目比较老,很多年以前开发的软件,但是具体做什么业务我不知道。下面来看日志的报错分析。 问题&#…

【Linux】软硬链接

文章目录 软链接硬链接软硬链接的使用场景:软链接的使用场景硬链接的应用场景 总结 软链接 软链接是一种指向文件或目录的快捷方式,是文件系统中非常重要的功能。它类似于Windows中的快捷方式,但更灵活,可以跨文件系统创建。 ln…

操作系统(5)进程

一、定义与特点 定义:进程是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。 特点: 动态性:进程是动态创建的,有它自身的生命周期,…

安宝特分享 | AR技术助力医院总院与分院间的远程面诊

随着科技的迅猛发展,增强现实(AR)技术在各行各业的应用愈发广泛,特别是在医疗领域,其潜力和价值正在被不断挖掘。在现代医疗环境中,患者常常面临“看病难、看病远、看病急”等诸多挑战,而安宝特…

CNCF云原生生态版图-分类指南(三)- 运行时

CNCF云原生生态版图-分类指南(三)- 运行时 CNCF云原生生态版图-分类指南三、运行时(Runtime)(一)云原生存储(Cloud Native Storage)1. 是什么?2. 解决什么问题&#xff1…

通俗易懂的 Nginx 反向代理 配置

通俗易懂的 Nginx 反向代理 配置 首先 root 与 alias 的区别 root 是直接拼接 root location location /i/ {root /data/w3; }当请求 /i/top.gif ,/data/w3/i/top.gif 会被返回。 alias 是用 alias 替换 location location /i/ {alias /data/w3/images/; }当请…

HiveQL命令(一)- 数据库操作

文章目录 前言一、数据库操作1. 创建数据库1.1 语法及解释1.2 创建数据库示例 2. 查看数据库2.1 查看所有数据库2.2 查看数据库信息2.2.1 语法及解释2.2.2 查看数据库信息示例 3. 切换数据库3.1 语法3.2 示例 4. 修改数据库4.1 语法4.2 示例 5. 删除数据库5.1 语法及解释5.2 示…

Ubuntu22.04安装docker desktop遇到的bug

1. 确认已启用 KVM 虚拟化 如果加载了模块,输出应该如下图。说明 Intel CPU 的 KVM 模块已开启。 否则在VMware开启宿主机虚拟化功能: 2. 下一步操作: Ubuntu | Docker Docs 3. 启动Docker桌面后发现账户登陆不上去: Sign in | …

FPGA实现GTP光口数据回环传输,基于Aurora 8b/10b编解码架构,提供2套工程源码和技术支持

目录 1、前言工程概述免责声明 2、相关方案推荐我已有的所有工程源码总目录----方便你快速找到自己喜欢的项目我这里已有的 GT 高速接口解决方案 3、工程详细设计方案工程设计原理框图用户数据发送模块基于GTP高速接口的数据回环传输架构GTP IP 简介GTP 基本结构GTP 发送和接收…

(二)多智能体强化学习

目录 前言 一、多智能体强化学习的概念 二、多智能体面临的问题 三、现有算法简介 总结 前言 基于上一篇文章对于强化学习基础概念的介绍,本篇文章针对多智能体强化学习进行介绍和总结,帮助大家了解多智能体的基本概念以及算法,方便大家…

【Linux网络编程】传输协议UDP

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站 🌈个人主页: 南桥几晴秋 🌈C专栏: 南桥谈C 🌈C语言专栏: C语言学习系…

汽车车牌识别数据集,支持YOLO,COCO,VOC格式的标注,8493张图片,可识别多种环境下的车牌

汽车车牌识别数据集,支持YOLO,COCO,VOC格式的标注,8493张图片,可识别多种环境下的车牌 数据集分割 训练组82% 6994图片 有效集12% 999图片 测试集6% 500图片 预处理 自动…

流网络复习笔记

所以这里的19是118-019 <s , w> 1/3就是容量是3&#xff0c;流量是1 残留网络就是两个相对箭头上都是剩余对应方向还能同行的流量 所以s->w 3-1 2, w->s 1

Mac m2电脑上安装单机Hadoop(伪集群)

1. 引言 本教程旨在介绍在Mac 电脑上安装Hadoop 2. 前提条件 2.1 安装JDK Mac电脑上安装Hadoop&#xff0c;必须首先安装JDK&#xff0c;并配置环境变量&#xff08;此处不做详细描述&#xff09; 2.2 配置ssh环境 关闭防火墙 在Mac下配置ssh环境&#xff0c;防止后面启…