【论文阅读】ESRGAN

【论文阅读】ESRGAN

news/2024/12/25 10:25:16/文章来源:https://blog.csdn.net/Winkyyyyyy/article/details/143194311

学习资料

论文题目：增强型超分辨率生成对抗网络（ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks）
论文地址：[1809.00219] ESRGAN：增强型超分辨率生成对抗网络
代码：xinntao / ESRGAN：ECCV18 研讨会 - 增强的 SRGAN。Champion PIRM Challenge 关于感知超分辨率。训练代码位于 BasicSR 中。

1. WHY

SRCNN→SRGAN

以PSNR为导向的方法往往输出过于平滑的结果，缺乏足够的高频细节，因为 PSNR指标在根本上与人类观察者的主观评估不一致。

所以提出了基于感知驱动的方法。感知损失（感知损失聚焦特征空间，通过比较生成图像与真实图像在预训练网络中的特征，使模型学习到高级语义特征。这有助于生成更逼真自然、纹理细节丰富且视觉效果更好的超分辨率图像，提升模型对图像的理解与重建能力）被提出用于在特征空间而不是像素空间中优化超分辨率模型。GAN被引入到SRIR，以鼓励网络倾向于看起来更像自然图像的解决方案。进一步结合语义图像先验（利用图像中物体、场景等的已有知识。比如知道天空在上且颜色均匀，以此引导模型生成更合理的高分辨率图像，改善纹理细节，让结果更符合视觉认知），以改善恢复的纹理细节。

追求视觉愉悦结果的一个里程碑是 SRGAN。基本模型是通过残差块 [18] 构建的，并在 GAN 框架中使用感知损失进行优化。通过所有这些技术，SRGAN 显著提高了重建的整体视觉质量，超过了以 PSNR 为导向的方法。

SRGAN→ESRGAN

尽管已有如 SRGAN 等感知驱动方法改善了视觉效果，但生成的细节仍伴有不良伪影，与真实图像 $GT$ 存在明显差距，因此需要进一步提升超分辨率图像的视觉质量。

2. WHAT

我们采用SRResNet的基本架构，其中大部分计算在LR特征空间中进行。我们可以选择或设计“基本模块Basic Block”（例如，残差模块，密集模块，RRDB）以获得更好的性能。

2.1. 生成器改进

为了进一步提高SRGAN恢复图像的质量，我们主要对生成器 $G$ 的结构进行了两项修改：

2.1.1. 去除 BN 层

原因

BN 层在训练时用批次均值和方差归一化特征，测试时用训练集估计均值和方差。当训练和测试数据集统计特征差异大时，会引入伪影且限制泛化能力。在 GAN 框架下训练且网络深时，BN 层更易产生伪影，违反稳定训练需求。

效果

去除 BN 层可实现稳定训练和一致性能，节省计算资源和内存，在某些情况下还能带来轻微性能改善。

2.1.2. 采用 RRDB 块

结构特点

RRDB 具有残差 - 残差结构，在不同层次进行残差学习，主路径中使用稠密块，网络容量因稠密连接而提高。比 SRGAN 中原始残差块更深更复杂。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/455815.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【机器学习】VQ-VAE（Vector Quantized Variational Autoencoder）

【机器学习】VQ-VAE（Vector Quantized Variational Autoencoder）

VQ-VAE（Vector Quantized Variational Autoencoder）是一种生成模型，它结合了变分自编码器（Variational Autoencoder, VAE）和向量量化（Vector Quantization）技术。VQ-VAE的主要目的在于通过离散潜…

阅读更多...

【动态规划】子序列问题（上）

【动态规划】子序列问题（上）

1. 最长递增子序列 300. 最长递增子序列和子数组不同的是，子数组要求是连续的，子序列只要下标是递增的就可以，这里严格递增的意思是不能有相等的元素，必须一直递增状态表示：以 i 位置为结尾的所有的子序列中最长递…

阅读更多...

Android GPU Inspector分析帧数据快速入门

Android GPU Inspector分析帧数据快速入门

使用谷歌官方工具Android GPU Inspector (AGI) 可以对Android 应用进行深入和全面的系统性能分析和帧性能分析。AGI 是一个非常强大的分析工具，尤其是在需要诊断 GPU 性能问题和优化应用时，可以帮助你精准找到性能瓶颈。本文介绍如何使用该工具对帧数据…

阅读更多...

梳理一下spring中，与message相关的知识点

本次梳理的相关知识点包括jms，amqp(rabbitmq)，sping-messaging，spring-integration，springcloud-stream，这些都是与消息message相关的内容，它们有什么区别与联系呢？ 相关的要点与相互关系都整理…

阅读更多...

物联网消息队列Emqx日志配置及日志追踪以及Centos7上的rc.local开机不执行、git提交的小问题

物联网消息队列Emqx日志配置及日志追踪以及Centos7上的rc.local开机不执行、git提交的小问题

一、物联网消息队列Emqx日志配置及日志追踪 EMQX支持将日志输出到控制台或者日志文件，或者同时使用两者。使用 Docker 部署 EMQX，默认只能通过 docker logs 命令查看 EMQX 日志。EMQX 的默认日志级别为 warning，默认在单日志文件超过10MB(log…

阅读更多...

word压缩大小怎么弄？快来试试这几种压缩word方法！

word压缩大小怎么弄？快来试试这几种压缩word方法！

word压缩大小怎么弄？在处理Word文档时，如果遇到体积过大的情况，无疑会带来一系列麻烦，大型Word文档不仅占据大量存储空间，而且在传输过程中会耗费更多时间，想象一下，当你急需将一份重要的文档发…

阅读更多...

Perl打印9x9乘法口诀

Perl打印9x9乘法口诀

本章教程主要介绍如何用Perl打印9x9乘法口诀。一、程序代码 1、写法① use strict; # 启用严格模式，帮助捕捉变量声明等错误 use warnings; # 启用警告，帮助发现潜在问题# 遍历 1 到 9 的数字 for my $i (1..9) {# 对于每个 $i，遍历 1…

阅读更多...

【设计模式系列】观察者模式

【设计模式系列】观察者模式

一、什么是观察者模式观察者模式（Observer Pattern）是一种行为设计模式，它定义了对象之间的一对多依赖关系，当一个对象的状态发生变化时，所有依赖于它的对象都会得到通知并自动更新。这种模式也被称为发布-订阅模式&…

阅读更多...

【AscendC算子开发】笔记2 算子高级开发和调试调优

【AscendC算子开发】笔记2 算子高级开发和调试调优

算子调试 Tensor也可以通过特定的printf方法来打印，见上图。 gdb调试见上图。为什么gdb调试无法成功，因为run.sh里面有两行export，如果直接通过.XX运行的话需要配置一下。 npu域也支持调试，可以使用上述的方法。内存检测工…

阅读更多...

AI自动生成PPT哪个软件好？智能生成PPT不再熬夜做课件

AI自动生成PPT哪个软件好？智能生成PPT不再熬夜做课件

大概这世上，都是职场牛马对“PPT”这三个字母的头痛反应最大吧！ 是的，就连各个年级段的老师也是很头痛——愁着怎样能在排版整齐的情况下，将必考知识点都呈现在PPT每一张幻灯片页面里...... 近期打听到用人工智能生成ppt课件&am…

阅读更多...

ProtoBuf 的含义和安装

ProtoBuf 的含义和安装

ProtoBuf 是什么 Protocol Buffers 是 Google 的⼀种语⾔⽆关、平台⽆关、可扩展的序列化结构数据的⽅法，它可⽤于（数据）通信协议、数据存储等。 Protocol Buffers 类⽐于、 XML，是⼀种灵活，⾼效，⾃动化机…

阅读更多...

Java项目-基于springboot框架的智慧外贸系统项目实战(附源码+文档)

Java项目-基于springboot框架的智慧外贸系统项目实战(附源码+文档)

作者：计算机学长阿伟开发技术：SpringBoot、SSM、Vue、MySQL、ElementUI等，“文末源码”。开发运行环境开发语言：Java数据库：MySQL技术：SpringBoot、Vue、Mybaits Plus、ELementUI工具：IDEA/…

阅读更多...

2024年最新苹果iOS证书申请创建App详细图文流程

2024年最新苹果iOS证书申请创建App详细图文流程

iOS 证书设置指南： 对于开发者来说，在没有Mac电脑或对Xcode等开发工具不熟悉的情况下，如何快速完成IOS证书制作和IPA文件提交至开发者中心一直是一个难题。但是现在，有了初雪云提供的极简工具，您可以轻松实现这两个任…

阅读更多...

Tomcat隐藏版本号和报错信息

Tomcat隐藏版本号和报错信息

为了避免漏洞扫描的时候造成版本泄露，可以在conf/server.xml配置文件中的<Host>配置项中添加如下配置: <Valve className"org.apache.catalina.valves.ErrorReportValve" showReport"false" showServerInfo"false" /> …

阅读更多...

c语言内核链表

c语言内核链表

c语言内核链表在Linux中拥有大量的内核源码，在数据存储的这块位置拥有内核链表（双向循环链表） 由linux内核提供的链表文件，里面包含了多组内联函数和宏定义函数以及功能性函数。内核链表中定义了多个函数，我们只需要…

阅读更多...

(gersemi) CMake 格式化工具

(gersemi) CMake 格式化工具

文章目录 🧮介绍🧮安装🧮使用🗳️模式 modes🗳️样式配置 config ⭐END🌟help🌟交流方式 🧮介绍 BlankSpruce/gersemi: A formatter to make your CMake code the real treasure A f…

阅读更多...

关闭或开启Win11系统的自动更新

关闭或开启Win11系统的自动更新

Win11系统老是自动更新，每次更新后不仅拖慢计算机的运行速度，甚至打印机都无法使用了，给我们带来了很多困扰。那么我们该如何彻底关闭Win11系统的自动更新呢？关闭Win11系统自动更新会有什么弊端呢？ 下面就分享几个小方…

阅读更多...

NVIDIA 发布适用于网络安全的 NIM Blueprint

NVIDIA 发布适用于网络安全的 NIM Blueprint

德勤使用适用于容器安全的 NVIDIA NIM Agent Blueprint 帮助企业利用开源软件构建安全的 AI。文章目录 🙊 德勤使用 NVIDIA AI 保障软件安全🙊 通过生成式 AI 保障软件安全🙊 适用于网络安全成功的蓝图🎠 什么是 NVIDIA NIM Agen…

阅读更多...

ESP32移植Openharmony外设篇（3）OLED屏

ESP32移植Openharmony外设篇（3）OLED屏

模块简介产品介绍 OLED (Organic Light-Emitting Diode)：有机发光二极管又称为有机电激光显示，OLED显示技术具有自发光的特性，采用薄的有机材料涂层和玻璃基板，当有电流通过时，这些有机材料就会发光，而且…

阅读更多...

数组中的算法

数组中的算法

目录 1.什么是数组 2.数组上的算法 2.1二分查找算法什么是二分查找算法？ 算法步骤算法时间复杂度一个问题例题题目分析解题代码 2.2双指针法什么是双指针法？ 例题题目分析解题代码 1.什么是数组数组是在一块连续的内存空间…

阅读更多...

最新文章

推荐文章