【零参考GAN:Pansharpening】

ZeRGAN: Zero-Reference GAN for Fusion of Multispectral and Panchromatic Images

(用于多光谱和全色图像融合的零参考GAN)

本文提出了一种融合低空间分辨率多光谱(LR MS)和高空间分辨率全色(PAN)图像的新的全色锐化方法–零参考生成对抗网络(ZeRGAN)。在该方法中,零参考表示它不需要使用成对的缩小尺度图像或未成对的全尺度图像进行训练。为了得到准确的融合结果,我们在一组多尺度生成器和它们对应的鉴别器之间建立了一个对抗性博弈。通过多尺度生成器,融合的高空间分辨率MS(HRMS)图像逐步从LR MS和PAN图像产生,而鉴别器的目的是区分HRMS图像和PAN图像之间的空间信息的差异。换句话说,在优化ZeRGAN之后,从LR MS和PAN图像生成HR MS图像。此外,我们构建了一个非参考损失函数,包括对抗性损失,空间和光谱重建损失,空间增强损失和平均恒定性损失。通过最小化总损失,可以有效地增强HRMS图像中的空间细节。在不同卫星采集的数据集上进行了大量的实验。

INTRODUCTION

近年来,不同的地球观测卫星,如QuickBird,GeoEye-1和WorldView-2收集了大量的遥感图像。这些卫星可以同时获取低空间分辨率多光谱图像和全色图像。目前,所捕获的图像已广泛且成功地用于目标发现、土地覆盖分析和环境监测。然而,由于空间和光谱分辨率之间的固有权衡,难以获得上述卫星的高空间和光谱分辨率MS(HR MS)图像。一方面,LR MS图像包含丰富的光谱信息,但空间分辨率低于PAN图像。另一方面,PAN图像仅由一个高空间分辨率带组成。因此,通过将LR MS图像中的光谱信息与PAN图像中的空间细节整合在一起,应用图像融合(也称为泛锐化)来产生融合的HR MS图像。
在过去的二十年中,已经提出并开发了各种算法来科普全色锐化任务。它们可以分为四种类型:1)组分替代(CS)方法; 2)多分辨率分析(MRA)方法; 3)基于退化模型(DM)的方法;以及4)基于深度神经网络(DNN)的方法。CS方法因其原理简单、实现速度快而得到了广泛的应用。他们将插值的LR MS图像投影到一个新的域中以估计合适的空间分量。然后用PAN图像代替空间分量,并通过相应的逆投影生成融合的HR MS图像。例如,在这种情况下使用的典型变换是强度-色调-饱和度(IHS)变换、主成分分析(PCA)和Gram-Schmidt(GS)变换。此外,提出了频带相关空间细节(BDSD)算法,以更准确地估计增益参数。然而,由于在图像之间考虑了全局变换,因此在融合结果中产生了显著的光谱失真。
基于MRA的方法假设要添加到LR MS图像中的空间信息是从PAN图像中获取的,这被称为结构注入空间分辨率改善(ARSIS)。在这些方法中,空间细节的提取和注入增益的计算对融合结果有重要影响。通过许多MRA工具提取空间细节,例如contourlet和广义拉普拉斯金字塔。Otazu等人提出了一种加性小波亮度比例(AWLP)方法来估计PAN图像中的高频分量。由于只有PAN图像的空间细节被注入到LR MS图像中,因此基于MRA的融合结果在光谱保真度方面具有良好的性能。
基于DM的方法假设所观察到的LR MS和PAN图像分别是空间域和谱域中的HR MS图像的退化版本。例如,Li和Yang通过将空间和光谱DM视为测量矩阵,将图像融合任务重新表述为压缩感知问题。此外,融合模型通过其他有效先验进行正则化,例如稀疏性,非负性和低秩先验。虽然这些方法在空间和光谱信息保持方面表现良好,但它们的计算复杂度远高于前两类方法。
如今,DNN已经在各个领域取得了巨大的成功,还被用于全息锐化。例如,Huang等人采用堆叠式改进稀疏去噪自动编码器进行全息锐化。Masi等人受文献[24]中超分辨率模型的启发,提出了一种基于卷积神经网络(CNN)的全息锐化方法–PNN。在[25]中,PANet是通过将特定问题的先验与残差网络(ResNet)相结合而建立的。该算法能较好地保持融合图像的光谱和空间保持性。随后,Fu等人引入了分组多尺度扩张网络,以提高空间信息的多尺度表示能力。Zhang等人提出了一种双向金字塔网络,将PAN图像中的空间细节逐层注入LR MS图像中。在[29]中,在分组贴片上构建了堆叠稀疏自动编码器。根据这些补丁的几何结构,他们被分类,然后送入自动编码器。此外,生成对抗网络(GAN)也被用于融合LR MS和PAN图像。例如,Liu等人首先利用GAN生成融合图像,然后在[32]中扩展。然后,Ma等人采用两个鉴别器来保持融合图像中的空间和光谱信息,这可以避免在训练期间需要HR MS图像。此外,在MDSSC-GAN中使用了生物多样性框架。在这种方法中,第一个滤波器由图像的亮度和近红外波段馈送,而第二个滤波器的输入是光谱分量的级联。在[35]中,提出了一种基于无监督GAN的方法,包括监督预训练和无监督微调。然而,基于DNN的泛锐化方法可能倾向于过拟合成对的训练数据。因此,当分析由其他卫星获得的新数据时,泛化能力降低。此外,需要考虑与训练数据有关的两个问题。一方面,大多数基于DNN的泛锐化方法通常使用成对图像进行训练,如图1(a)所示。但是,HR MS图像在真实的场景中不可用。因此,成对图像由空间退化后的LR MS和PAN图像的缩小比例版本组成。因此,原始LR MS图像直接被视为参考数据。然而,在全尺寸图像的空间细节不能有效地从缩小规模的图像对学习。另一方面,一些基于GAN的泛锐化方法被提出用于全尺度图像的显式训练,其中包含原始尺度的LR MS和PAN图像。它们也被称为未配对图像,如图1(b)所示。然而,这些网络需要重复训练,以获得理想的结果,因为不同的卫星图像之间的不同分布。此外,它们需要大量的训练数据。在这里插入图片描述
基于这两个方面,本文提出了一种基于GAN的零参考GAN(ZeRGAN)方法,用于由PAN图像锐化LR MS图像。如图1(c)所示,ZeRGAN不需要任何成对的缩小比例图像或未成对的全比例图像进行训练。因此,在对该方法的损失函数进行优化后,可以直接由多尺度发生器得到融合图像。特别是,我们采用了一组级联的多尺度生成器,逐步增加MS图像中的空间信息,同时保留光谱信息。在每个尺度上,残差学习被嵌入到生成器中,以改善中间HR MS图像中的空间细节。同时,在相同的尺度下,相应的缩放被用来进一步区分中间和真实的PAN图像中的空间信息。通过光谱响应滤波(SSF),从中间HR MS图像生成中间PAN图像。此外,为了确保零参考训练的融合性能,我们设计了一个无监督损失函数,其中包含对抗损失,空间和光谱重建损失,空间增强损失和平均恒定性损失,用于在每个尺度上优化生成器和滤波器。实验结果表明,即使没有任何训练集,ZeRGAN仍然具有竞争力的性能相比,依赖于配对或不配对的图像进行训练的方法。

贡献

1)ZeRGAN不需要任何训练数据。通过优化GAN并结合空间和光谱DM,实现了LR MS和PAN图像的融合。一个多尺度生成器架构被用来增强空间细节的LR MS图像协作。
2)一个任务驱动的非参考损失函数制定了一个有效的措施,融合图像中的空间和光谱信息,这减轻了大量的训练数据的需要。
3)对于光谱保存,我们引入了一个新的损失项,平均恒定性损失,它假设LR MS图像中的频带的平均值应相应地等于HR MS图像中的频带。

GENERATIVE ADVERSARIAL NETWORKS

自从GAN由Goodfellow等人提出以来由于其强大的生成能力,在图像处理和图像合成等各个领域的性能都有了显着的提高。GAN主要通过最小-最大对抗游戏学习生成器G和BND。生成器G可以学习数据分布,并创建真实的样本来欺骗CMDD。相反地,CNOD的目的是分类样本是由生成器G合成的还是来自真实的数据。然后,上述两个玩家的游戏可以在数学上表示为:在这里插入图片描述
然而,原始GAN遭受训练不稳定性。然后,提出了深度卷积GAN(DCGAN)来稳定GAN的训练,其中生成器和卷积神经网络都由CNN组成。Mao等人在最小二乘损失的约束下,惩罚假样本的分布更接近真实的数据的分布。Wasserstein GAN(WGAN)采用具有更好理论特性的Wasserstein距离来衡量真实的和虚假数据之间的差异。然而,WGAN的收敛是缓慢的,有时不稳定。因此,Gulrajani等人提出了WGAN-GP损失并引入梯度惩罚来直接保证Lipschitz条件,其目标函数为
在这里插入图片描述

PROPOSED METHOD

在这里插入图片描述

ZeRGAN的框架如图2所示,其中生成器和鉴别器分别主要负责注入和区分HR MS图像中的真实空间信息。更具体地说,一系列的生成器被设计为增强在不同尺度的中间HR MS图像的空间细节,同时保留光谱信息。此外,在每个尺度上的缩放还负责中间PAN图像和真实的PAN图像中的空间信息的一致性。通过SSF从中间HR MS图像产生中间PAN图像。此外,通过以不同比率下采样原始PAN图像来合成对应于不同尺度的真实的PAN图像。此外,一个无监督的损失来自空间光谱模型和先验知识,使零参考训练成为可能。虽然已经提出了许多基于GAN的泛锐化方法,例如PSGAN和MDSSC-GAN,但这些方法需要大量的成对图像进行训练。所提出的ZeRGAN不需要任何配对或未配对的数据,这消除了训练数据的问题。此外,现有的基于GAN的方法通常使用单个生成器来合成融合结果。ZeRGAN提出了由多个生成器组成的多尺度框架,从粗到细生成融合图像,以提高融合效果。

Multiscale Generator

多尺度发生器由L个级联的生成器组成,其中生成器Gl在尺度l处的输出是Hl R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,生成器Gl+1在尺度l + 1处的输入。M × N × B是原始LR MS图像H0的大小。rl是H0和H1之间的空间分辨率比。因此,我们可以将LR MS图像在不同尺度下的连续增强写为:在这里插入图片描述
其中Hl-1和Pl都被馈送到发生器Gl。通过下采样从原始PAN图像生成Pl。注意,Pl的大小与Hl的大小一致。然后,期望的HR MS图像是HL R r l M × r l N × B R^{r_l M×r_l N×B} RrlM×rlN×B,即GL在尺度L下的输出。通常,在全色锐化任务中rL等于4。在这里插入图片描述
不同规模的生成器的架构如图3所示。对于生成器的输入,我们首先通过双三次算子将MS图像Hl-1直接上采样到真实的PAN图像P1的大小。然后,将上采样的MS图像与PAN图像连接在一起作为生成器的输入。生成器由五个卷积层组成。过滤器大小为3 × 3,步长为1。对于前四个卷积层,滤波器的数量设置为n。在最后一个卷积层中使用了四个滤波器。Leaky ReLU激活函数应用于前四个卷积层。批量归一化(BN)也被级联以防止梯度消失。为了充分利用以前的功能,在生成器中引入了密集连接。通过密集连接,可以加强不同层中的特征传播,从而有效地将空间细节注入HRMS图像。

Spatial Discriminator

在ZeRGAN的架构中,鉴别器{D1,D2,.,DL }被设计为由于SSF的引入而间接地区分HR MS图像中的空间信息。SSF被建模为在这里插入图片描述
其中 H b H^b Hbl是Hl的第b个频带,并且ωb是固定的光谱响应权重。经由SSF从MS图像Hl-1产生中间PAN图像~P 1
在这里插入图片描述
为了有效地捕获真实的和中间PAN图像的分布之间的差异,构造完全卷积网络,其结构在图4中示出。卷积Dl由五个卷积层组成,其中前四层中的每一层都包含n个大小为3 × 3的内核。最后一个卷积层只包含一个大小为3 × 3的滤波器。此外,前四个卷积层与BN和Leaky ReLU连接。完全卷积设置用于有效地对图像中的空间细节进行建模。在所提出的方法中,所有不同尺度的所有鉴别器共享相同的架构。

Nonreference Loss Function

在ZeRGAN中,多尺度生成器和鉴别器是通过无监督训练过程依次学习的。在所提出的方法中,生成的HR MS图像不仅要欺骗鉴别器,而且要满足与源图像的退化关系和其他约束。因此,我们在生成器上施加额外的损失以实现有效的学习。考虑以下损失来训练所提出的模型。
Spatial and Spectral Reconstruction Losses: 通常,LR MS和PAN图像分别被视为HR MS图像的空间和光谱退化结果。具体地,尺度l的空间和光谱观测模型被定义为:在这里插入图片描述
滤波器是钟形的,可以近似为高斯滤波器[46]。n1和n2是加性噪声。因此,空间和光谱退化损失可以公式化为:在这里插入图片描述
其中α和β是正则化参数。(7)中的两个约束分别是空间保真度项和光谱保真度项。然后, L l L^{l} Llsr可以保留空间和光谱信息,并在这两项之间进行折衷,由α和β值进行调整。
1) Spatial Enhancement Loss: 对于不同波段的MS图像,由于其光谱响应,边缘或纹理有明显的差异。使用相同的空间增强策略将导致不同频带上的伪影。在所提出的方法中,假设Hl中的高频信息遵循与(6)相同的谱退化关系,其类似地表示为在这里插入图片描述
其中▽梯度算子用于高频信息提取。然后,可以通过以下方式实现空间增强:在这里插入图片描述
2) Average Constancy Loss: 受[47]中的颜色恒定性损失的启发,我们提出了平均恒定性损失来保留HR MS图像中的光谱信息。假设LR MS图像中的谱带的平均值应相应地等于HR MS图像中的谱带的平均值。通过这一假设,LR MS图像的波段之间的关系可以继承到HR MS图像的波段之间的关系。然后,平均恒定性损失被建模为在这里插入图片描述
3) Adversarial Loss: 在所提出的方法中,利用从Hl生成的中间PAN图像~ Pl来欺骗鉴别器Dl。为了保证训练的稳定性,该方法考虑了WGAN-GP损失在这里插入图片描述
将上述所有损失合并在一起,第l级的总损失总结为:在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/177465.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

(一)、ts 基础类型 及class类举例字符雨和实现vue的挂在#app

文章目录 前言环境执行依赖node.js一、基础数据类型二、任意类型三、接口和对象类型四、 数组类型五、函数重载六、类型断言断言联合类型交叉类型 七、内置对象-Promise基础对象DOM和BOMPromise ts化代码雨案例 八、Class类(派生类和抽象类)派生类 abstract抽象类 classClass简…

自定义SpringBoot启动图标

在SpringBoot项目的resources目录下创建banner.txt文件 在https://www.bootschool.net/网站上复制Ascll艺术字(图)粘贴到banner.txt中保存。 启动项目就会加载 可以修改颜色,和版本号 ${application.version} 输出版本 ${spring-boot.v…

「软件设计师」 2023年上半年上午真题解析

「软件设计师」 2023年上半年上午真题解析 提示:系列被面试官问的问题,我自己当时不会,所以下来自己复盘一下,认真学习和总结,以应对未来更多的可能性 关于互联网大厂的笔试面试,都是需要细心准备的 &…

8. 一文快速学懂常用工具——Linux命令(上)

本章讲解知识点 引言 指令学习 本专栏适合于软件开发刚入职的学生或人士,有一定的编程基础,帮助大家快速掌握工作中必会的工具和指令。本专栏针对面试题答案进行了优化,尽量做到好记、言简意赅。如专栏内容有错漏,欢迎在评论区指…

Debug技巧-不启用前端访问后端

在日常开发中,我们经常会遇到各种问题需要调试,前后端都启动需要耗费一定的时间和内存,方便起见,可以直接用抓包数据访问后端,这里我们需要用到Postman或者ApiFox 抓包数据 在系统前台触发后端请求,在控制…

MyBatis入门

MyBatis是一款优秀的持久层框架,用于简化JDBC开发 持久层: 负责将数据保存到数据库的那一层代码 我们会将操作数据库的Java代码作为持久层,而MyBatis就是对jdbc代码进行了封装。 JavaEE三层架构:表现层、业务层、持久层 框架&…

mysql之索引

一、索引的概念 1、索引:是一个排序的列表,列表当中存储的是索引的值和包含之值的数据所在行的物理地址 2、主要作用:快速查找,加快查询速度 3、索引的缺点:索引也占用额外的磁盘 (1)innodb…

Stable Diffusion WebUI扩展openpose-editor如何使用

先上地址: GitHub - fkunn1326/openpose-editor: Openpose Editor for AUTOMATIC1111s stable-diffusion-webuiOpenpose Editor for AUTOMATIC1111s stable-diffusion-webui - GitHub - fkunn1326/openpose-editor: Openpose Editor for AUTOMATIC1111s stable-diffusion-webu…

[SpringCloud | Linux] CentOS7 部署 SpringCloud 微服务

目录 一、环境准备 1、工具准备 2、虚拟机环境 3、Docker 环境 二、项目准备 1、配置各个模块(微服务)的 Dockerfile 2、配置 docker-compose.yml 文件 3、Maven 打包 4、文件整合并传输 三、微服务部署 1、部署至 Docker 2、访问微服务 四…

nacos在linux中的安装、集群的配置、mysql生产配置

1.下载和安装 官方下载地址:https://github.com/alibaba/nacos/releases,根据自己需要的本版去下载就行 下载的是 .tar.gz 后缀的文件是linux版本的 使用tar命令解压,完成之后是一个nacos的文件夹 和windows下的文件夹目录是一样的 要启…

MICCAI2023论文多模态论文速读-1

文章目录 1.Attentive Deep Canonical Correlation Analysis for Diagnosing Alzheimer’s Disease Using Multimodal Imaging Genetics2.Bidirectional Mapping with Contrastive Learning on Multimodal Neuroimaging Data3.CoLa-Diff: Conditional Latent Diffusion Model f…

【算法练习Day35】01背包问题分割等和子集

​📝个人主页:Sherry的成长之路 🏠学习社区:Sherry的成长之路(个人社区) 📖专栏链接:练题 🎯长路漫漫浩浩,万事皆有期待 文章目录 01背包问题分割等和子集总结…

Proteus仿真--基于51单片机的按键控制LED仿真(仿真文件+程序)

本文主要介绍基于51单片机的按键控制LED仿真(完整仿真源文件及代码见文末链接) 本仿真文件主要涉及4个按键,其中: K1按键的逻辑是——逐个点亮 K2按键的逻辑是——上四个点亮 K3按键的逻辑是——下四个点亮 K4按键的逻辑是——关…

HarmonyOS鸿蒙原生应用开发设计- 元服务(原子化服务)图标

HarmonyOS设计文档中,为大家提供了独特的元服务图标,开发者可以根据需要直接引用。 开发者直接使用官方提供的元服务图标内容,既可以符合HarmonyOS原生应用的开发上架运营规范,又可以防止使用别人的元服务图标侵权意外情况等&…

Http代理与socks5代理有何区别?如何选择?(一)

了解SOCKS和HTTP代理之间的区别对于优化您的在线活动至关重要,无论您是技术娴熟的个人、现代互联网用户还是企业所有者。在使用代理IP时,您需要先了解这两种协议之间的不同。 一、了解HTTP代理 HTTP(超文本传输协议)代理专门设计…

【Java 进阶篇】Java中的响应输出字节数据

在Java Web应用程序开发中,处理响应是一个常见的任务。有时,您可能需要向客户端发送字节数据,而不仅仅是文本或HTML内容。这可以用于传输各种内容,如图像、文件、视频等。本文将详细介绍如何在Java中使用Response对象输出字节数据…

在 Typescript 项目中使用 cdn 加载的js插件没有类型声明

先上一段同事写得代码, 此处动态的插入了 MathJax 这个 js 插件, 我不知道为什么如此编写, //ts-ignore 此处不知道为什么如此调用, 只能使用 ts-ignore 忽略dynamicLoadingJs("//xxx.com/latex/MathJax.js?configTeX-AMS_HTML", () > {MathJax.Hub.Config({exte…

[Docker]四.Docker部署nodejs项目,部署Mysql,部署Redis,部署Mongodb

一.部署nodejs项目,映射端口,挂载数据卷 可以到https://hub.docker.com/去搜索node镜像,然后下载,也可以直接通过docker pull node下载镜像,然后用这个node镜像启动容器node,这样系统就集成了node服务了,在这里挂载www/node目录到容器中,并指定端口映射,运行nodejs程序,安装npm…

【机器学习合集】模型设计之残差网络 ->(个人学习记录笔记)

文章目录 模型设计之残差网络1. 什么是残差结构1.1 网络加深遇到的优化问题1.2 short connect技术 2. 残差网络及有效性理解2.1 残差网络 3. 残差网络的发展3.1 密集残差网络3.2 更宽的残差网络(wide resnet)3.3 分组残差网络3.4 Dual Path Network3.5 加权残差网络3.6 预激活残…

CSS3网页布局基础

CSS布局始于第2个版本,CSS 2.1把布局分为3种模型:常规流、浮动、绝对定位。CSS 3推出更多布局方案:多列布局、弹性盒、模板层、网格定位、网格层、浮动盒等。本章重点介绍CSS 2.1标准的3种布局模型,它们获得所有浏览器的全面、一致…