TGRS | 可变形傅里叶卷积用于遥感道路分割

题目:Fourier-Deformable Convolution Network for Road Segmentation From Remote Sensing Images

期刊:IEEE Transactions on Geoscience and Remote Sensing

论文:https://ieeexplore.ieee.org/document/10707598/

代码:https://github.com/zhoucharming/FDNet

年份:2024

单位:南京理工

背景:

道路从遥感图像中的分割是一个关键任务,对于许多应用领域来说都非常重要,包括城市规划、智能交通系统、自动驾驶、车辆导航、道路监控和紧急管理等。然而,这一任务面临几个挑战:

  1. 不规则道路网络:道路网络可能非常复杂和不规则,这使得自动化的分割变得困难。
  2. 复杂背景和遮挡:树木和建筑物等造成的遮挡,以及背景的复杂性,都给道路的识别带来了挑战。
  3. 传统方法的局限性:早期的研究依赖于传统的图像分析方法,这些方法依赖于专家知识和手动参数调整,通常依赖于结构特征(如纹理、对比度和形状)或光谱特征。这些传统方法在某些特定场景下表现良好,但通常需要更多的先验知识和专家经验,难以泛化到更一般的情况。
  4. 深度学习方法的发展:深度神经网络(如SegNet、UNet及其变体)通过参数共享和强大的特征捕获能力,提高了道路分割的性能。

文章中提到,尽管深度学习方法在遥感图像分析上取得了显著成果,但在可靠的道路分割方面仍存在一些挑战,包括:

  • 道路在大小、形状、纹理和周围环境上的差异使得固定卷积模式的分割变得具有挑战性。
  • 道路常与周围特征(如建筑物、植被和阴影)混合,使得在空间域中难以区分。
  • 遥感图像可能受到噪声、模糊或低对比度的影响,道路对象通常微弱且难以分割。
  • 道路与河流和沟渠在几何上相似,容易导致误分类。

这些挑战促使研究者探索新的方法来提高道路分割的准确性和鲁棒性,这也是本文提出FDNet模型的背景和动机。

解决的问题:

文章针对的主要问题是如何在遥感图像中准确分割道路,这在城市规划、智能交通系统、自动驾驶、车辆导航、道路监控和紧急管理等多个领域都有重要应用。

贡献:

  1. 提出了一种新的网络架构,称为U形傅里叶可变形卷积网络(FDNet),它结合了可变形卷积(DCs)和傅里叶卷积的优势。
  2. 提出了一种新的基于迭代动态偏移学习机制的显著性感知可变形卷积(SD-Conv)层,用于追踪显著的道路特征。
  3. 引入了一种基于谱卷积的轻量级全局特征提取模块,称为自适应傅里叶卷积(AFConv)层,用于学习长距离依赖关系,提取长且连续的道路结构。
  4. 提出了一种基于Hausdorff距离(HD)在持久图(PD)上的拓扑导向损失函数,并结合softDice损失组件,以全监督的方式训练模型。
  5. 在两个基准数据集上进行了训练和评估,实验结果表明FDNet达到了最先进的性能。

具体的方法和网络结构:

FDNet遵循经典的U-Net架构,包括对称的编码器和解码器部分,以及阶段间跳跃连接,用于浅层到深层特征融合。网络的核心是FD-Conv块,它并行地结合了SD-Conv层和AF-Conv层。

图1为 FDNet的整体结构和FD-Conv模块的组成,

  • 图1(a) 展示了FDNet的整体结构,它遵循经典的U-Net架构,包括对称的编码器和解码器部分,以及阶段间跳跃连接,用于从浅层到深层的特征融合。
  • 图1(b) 展示了FD-Conv模块的组成,其中SD-Conv代表显著性感知的可变形卷积,AF-Conv代表自适应频率卷积。这个模块是FDNet的核心,设计为并行处理,用于精细和弱小道路对象提取以及长且连续道路结构的把握。
  • 图1(c) 展示了ResBlock-D和ResBlock-U的组成,这些是在编码器和解码器中使用的残差块。

SD-Conv层:

SD-Conv(Saliency-Aware Deformable Convolution)是一种新型的可变形卷积层,它在文章中被提出用于道路分割任务,特别是在遥感图像中。SD-Conv的设计旨在捕捉细微、脆弱和多样化的道路结构。以下是SD-Conv的一些关键特点和工作原理:

关键特点:

  1. 动态偏移学习机制:SD-Conv层通过学习动态偏移量来调整卷积核的采样位置,这些偏移量可以根据输入特征图中的显著性进行调整。

  2. 显著性感知:SD-Conv能够识别并追踪显著的道路特征,如道路边缘和纹理,这使得它能够更准确地捕捉到道路的细微结构。

  3. 迭代策略:SD-Conv使用迭代策略来更新偏移量,这允许卷积核在多个方向(上、下、左、右)上顺序追踪显著特征。

  4. 多方向采样:SD-Conv不仅在水平和垂直方向上调整偏移,还能够在对角线方向上进行调整,以捕获更多方向上的道路特征。

工作原理:

  1. 卷积核偏移:在标准的卷积操作中,卷积核的采样位置是固定的。而在SD-Conv中,卷积核的采样位置可以根据学习到的偏移量进行调整,以适应输入特征图中的道路特征。

  2. 特征追踪:SD-Conv通过迭代地更新偏移量,使得卷积核能够沿着显著性特征从中心向外围追踪采样坐标,从而捕获长且连续的道路特征。

  3. 坐标计算:SD-Conv计算每个卷积核切片在不同方向上的采样坐标,这些坐标是基于学习到的偏移量和卷积核的中心坐标计算得出的。

  4. 双线性插值:由于学习到的偏移量可能是非整数,SD-Conv使用双线性插值来计算实际的采样点值,这有助于保持特征图的空间分辨率。

  5. 特征融合:SD-Conv将空间域和频率域的特征并行获取,并将这些特征在通道维度上进行拼接,然后通过1×1卷积层进行融合,以输出最终的特征图。

AFConv层(自适应傅里叶卷积):

AFConv层的灵感来自于自适应频率滤波神经网络(AFFNet),使用快速傅里叶变换(FFT)和逆快速傅里叶变换(IFFT)来实现全局特征提取。具体步骤如下:

  1. 使用FFT将输入特征图X转换到频域。
  2. 学习一个自适应的频谱掩码M,该掩码与输入特征图在频域中具有相同的维度。
  3. 在频域中,通过Hadamard积(即逐元素乘积)将掩码和特征图相乘,以提取显著的频谱分量。
  4. 使用IFFT将频域特征转换回空间域。

AFConv层通过这种自适应频率滤波操作,结合频域中的轻量级操作(如软掩码和轻量级卷积),旨在捕获精细的全局特征以检测长且连续的道路对象。

图3 展示了自适应频率滤波器(AF-Conv)的架构。这个架构使用了两个连续的1×1深度卷积层和一个ReLU激活函数来生成动态的频谱掩码,用于提取显著的频谱分量。图中的⊙代表Hadamard积操作。

损失函数:
 

文章中提出的损失函数是一种拓扑导向的损失函数,它基于持久同调(Persistent Homology,PH)理论,结合了Hausdorff距离(HD)和softDice损失。这个损失函数旨在训练过程中保持道路特征的连续性,特别是在复杂的道路条件下。以下是损失函数的详细描述:

拓扑导向损失函数(LSH)

组成部分:
  1. SoftDice损失(softDice)

    • SoftDice损失是一种用于不平衡分割任务的统计学损失函数,它衡量预测分割区域和真实标注区域之间的重叠程度。
    • SoftDice的计算公式为: 
    • 其中,MPMP 是预测掩码,MGMG 是真实标注掩码。
  2. Hausdorff距离(HD)

    • Hausdorff距离是一种衡量两个点集之间距离的度量,用于比较持久图(PD)之间的相似性。
    • 在持久同调的上下文中,HD用于衡量预测结果和真实标注之间的拓扑差异。
  3. 结合HD和softDice的加权损失(LSH)

    • 最终的损失函数是一个加权损失函数,结合了softDice损失和基于PH理论的拓扑损失。
    • 加权损失函数的计算公式为: LSH=(1−softDice)+λ×disHD∗其中,λλ 是一个用于平衡两个损失项的权重参数,disHD∗​ 是基于HD的拓扑损失。
拓扑损失(基于PH理论):
  • 持久同调(PH)是一种拓扑数据分析工具,用于计算空间中不同尺度下的拓扑特征。
  • 在道路分割任务中,PH可以用来捕捉道路的连通性特征,如0-D特征(连通分量)和1-D特征(环状结构)。
  • 基于PH生成的持久图(PD)包含了这些拓扑特征的“出生”和“死亡”时间,形成了一个点集,用于描述道路结构的演变。
  • Hausdorff距离(HD)用于衡量预测结果和真实标注之间的PD的相似性,从而提供了一种拓扑约束,帮助模型在训练过程中保持道路特征的连续性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/495333.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux复习4——shell与文本处理

认识vim编辑器 #基本语法格式: vim 文件名 •如果文件存在,进入编辑状态对其进行编辑 •如果文件不存在,创建文件并进入编辑状态 例: [rootlocalhosttest]# vim practice.txt #Vim 编辑器三种模式: 命令模式&a…

GIT与github的链接(同步本地与远程仓库)

1.官网下载GIT Git - 安装 Git 2.GIT生成密钥 2.1 打开gitbash配置邮箱与用户名(非初次使用GIT跳过这一步) git config --global user.name "你的用户名" git config --global user.email "你的邮箱" 2.2 生成ssh密匙 1&#xff0…

小程序租赁系统开发指南与实现策略

内容概要 在如今这个快节奏的时代,小程序租赁系统的开发正逐渐成为许多商家提升服务质量与效率的重要选择。在设计这样一个系统时,首先要明白它的核心目标:便捷、安全。用户希望在最短的时间内找到需要的物品,而商家则希望通过这…

深度学习之超分辨率算法——FRCNN

– 对之前SRCNN算法的改进 输出层采用转置卷积层放大尺寸,这样可以直接将低分辨率图片输入模型中,解决了输入尺度问题。改变特征维数,使用更小的卷积核和使用更多的映射层。卷积核更小,加入了更多的激活层。共享其中的映射层&…

vue3项目history路由模式部署上线405、刷新404问题(包括部分页面刷新404问题)

一、找不到js模块 解决方法:配置Nginx配置文件: // root /your/program/path/dist root /www/wwwroot/my_manage_backend_v1/dist;二、刷新页面导致404问题(Not found) 经过一系列配置后发现进入页面一切正常,包括路由前进和回退&#xff0…

微服务篇-深入了解 XXL-JOB 分布式任务调度的具体使用(XXL-JOB 的工作流程、框架搭建)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 XXL-JOB 调度中心概述 1.2 XXL-JOB 工作流程 1.3 Cron 表达式调度 2.0 XXL-JOB 框架搭建 2.1 XXL-JOB 调度中心的搭建 2.2 XXL-JOB 执行器的搭建 2.3 使用调度中心…

JS中若干相似特性的区别

Object.is与的区别? 其他时候都相等 字符串concat()和号有什么区别? 数组at和直接索引区别 at里是负值,计算方法是:数组的长度加这个负值,得到的数作为索引值 substring与slice的区别 substring是负值,则视为0,等于全部复制 slice是负值,则从后往前复制,-2就是复制最后2个字…

Fuel库实战:下载失败时的异常处理策略

Fuel库作为一个轻量级的Kotlin HTTP客户端库,因其简洁的API和强大的功能而受到开发者的青睐。然而,网络请求总是伴随着失败的风险,比如网络不稳定、服务器错误、资源不存在等。因此,合理地处理这些异常情况对于提升用户体验和应用…

vscode插件更新特别慢的问题

点击插件标题去网页查看 命令行安装 D:\Software\VSCode\Code.exe --extensions-dir "D:\Software\VSCode\extendions" --install-extension Vue.volar-2.2.0.vsix安装完成之后重启vs code即可 参考 https://www.cnblogs.com/yiquanfeng/p/18218722

2.利用docker进行gitlab服务器迁移

一、Docker安装 安装Ubuntu 22.04.3 LTS \n \l 1、旧版本安装包清理 sudo apt-get remove docker docker-engine docker.io containerd runc当你卸载Docker时,存储在/var/lib/docker/中的图像、容器、卷和网络不会自动删除。如果你想从一个干净的安装开始&#x…

大型语言模型(LLMs)演化树 Large Language Models

大型语言模型(LLMs)演化树 Large Language Models flyfish 下面的图来自论文地址 Transformer 模型(如 BERT 和 GPT-3)已经给自然语言处理(NLP)领域带来了革命性的变化。这得益于它们具备并行化能力&…

springboot477基于vue技术的农业设备租赁系统(论文+源码)_kaic

摘 要 使用旧方法对农业设备租赁系统的信息进行系统化管理已经不再让人们信赖了,把现在的网络信息技术运用在农业设备租赁系统的管理上面可以解决许多信息管理上面的难题,比如处理数据时间很长,数据存在错误不能及时纠正等问题。这次开发的农…

如何在 Ubuntu 22.04 上安装和使用 Composer

简介 如果你是一名 PHP 开发者,想要简化你的项目依赖管理,那么 Composer 是一个必不可少的工具。Composer 可以简化包管理,并允许你轻松地将外部库集成到你的项目中。 本教程将向你展示如何在 Ubuntu 22.04 操作系统上安装 Composer&#x…

16_HTML5 语义元素 --[HTML5 API 学习之旅]

HTML5 引入了许多新的语义元素,这些元素有助于创建结构更清晰、更具描述性的网页。语义化 HTML 不仅改善了代码的可读性,还增强了搜索引擎优化(SEO),提高了无障碍访问性,并使得开发者更容易理解和维护代码。…

国标GB28181视频监控平台与Liveweb视频监控汇聚平台对接方案

应急管理部门以“以信息化推动应急管理能力现代化”为总体目标,加快现代信息技术与应急管理业务深度融合,全面支持现代应急管理体系建设,这不仅是国家加强和改进应急管理工作的关键举措,也是应对日益严峻的应急管理形势和满足公众…

内部知识库的未来展望:技术融合与用户体验的双重升级

在当今数字化飞速发展的时代,企业内部知识库作为知识管理的关键载体,正站在变革的十字路口,即将迎来技术融合与用户体验双重升级的崭新时代,这一系列变化将深度重塑企业知识管理的格局。 一、技术融合:开启知识管理新…

EasyGBS国标GB28181公网平台P2P远程访问故障诊断:云端服务端排查指南

随着信息技术的飞速发展,视频监控领域正经历从传统安防向智能化、网络化安防的深刻转变。EasyGBS平台,作为基于国标GB28181协议的视频流媒体平台,为用户提供了强大的视频监控直播功能。然而,在实际应用中,P2P远程访问可…

HW护网分析研判思路,流量告警分析技巧

《网络安全自学教程》 这篇文章,写给每一个「护网黑奴」,为初次护网的小伙伴普及一下护网工作内容,提供一些简单的分析思路。 护网分析研判思路 1、护网组织架构和责任划分1.1、安全监控1.2、分析研判1.3、应急处置 2、分析研判2.1、判断告警…

springBoot发布https服务及调用

一、服务端发布https服务 1、准备SSL证书 (1)自签名证书:如果你只是用于开发或测试环境,可以生成一个自签名证书。 (2)CA 签名证书:对于生产环境,应该使用由受信任的证书颁发机构 …

Web 第一次作业 初探html 使用VSCode工具开发

目录 初探html? 代码展示&#xff1a; 初探html 大多数代码都比较冗长 不是很简洁 还有许多标签功能不会使用 记录一下成长过程 哈哈哈哈哈&#xff01;<–_–> 代码展示&#xff1a; 12.10首次确定书写对象 牢9门 <!DOCTYPE html> <html lang"en&quo…