图像超分辨率论文笔记

持续更新

Progressive Multi-Scale Residual Network for Single Image Super-Resolution

  • 论文链接:https://arxiv.org/pdf/2007.09552.pdf
  • 代码:PMRN (暂未公开)
  • 发表时间:2020.7
  • 网络结构:
    在这里插入图片描述
    1)包括三个部分特征提取、非线性特征抽取、重建;
    2)非线性特征抽取主要由PMRB模块构成;
    3)普通的多尺度是通过卷积层不同核大小实现的,当卷积核比较大时,所需参数量和计算量都比较大,本文以递归的形式采用相同卷积核尺寸(3*3)实现多尺度(递归结构换一种解释方法,个人认为创新性不大):
    在这里插入图片描述
    4)在PMRB中还采用了channel-Attention和pixel-Attention构成CPA:
    在这里插入图片描述
    5)损失函数为 l 1 l_1 l1loss;

Blind Super-Resolution Kernel Estimation using an Internal-GAN

  • 论文链接:https://arxiv.org/pdf/1909.06581v4.pdf
  • 代码:KernelGAN
  • 2019
  • 算法结构:
    在这里插入图片描述
    1)利用kernelGAN估计一幅真实LR图像的降质核;
    2)输入为真实的LR图像,从图像中随机切出的3000个 64 × 64 64\times64 64×64的图像块送入全卷积生成器G中,生成尺度缩小s倍的LR图像块,此处的损失函数除了对抗损失外,还有生成LR图像与对输入的 64 × 64 64\times64 64×64进行bicubic降采样间的MSE损失,还有对G模拟kernel核的限制;
    3)如何从G中提取对应的模拟核:对G输入1,输出即为模拟核;
    4)判别器,判断真实LR图像块和生成的LR图像块的真假,输出为像素级;
    5)超分采用ZSSR算法;

Real-World Super-Resolution via Kernel Estimation and Noise Injection

  • 论文链接:http://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Ji_RealWorld_SuperResolution_via_Kernel_Estimation_and_Noise_Injection_CVPRW_2020_paper.pdf
  • 代码:RealSR
  • CVPR2020, NTIRE2020 RWSR双赛道冠军
  • 算法结构:
    在这里插入图片描述
    1)提出新的数据制作方案:统计模糊核与真实噪声分布并用于制作训练数据对,确保生成的LR图像具有与源域图像相似的属性;2)判别器采用块判别器,可以去除伪影;
    2)计算模糊核,参考KernelGAN,满足的约束条件为
    a r g m i n ∣ ∣ ( I s r c ∗ k ) ↓ s − I s r c ↓ s ∣ ∣ 1 + ∣ 1 − ∑ k i , j ∣ + ∣ ∑ k i , j ⋅ m i , j ∣ + ∣ 1 − D ( ( I s r c ∗ k ) ↓ s ) ∣ ( 4 ) arg min||(I_{src}*k)\downarrow _s-I_{src}\downarrow _s||_1+|1-\sum k_{i,j}|+|\sum k_{i,j} \cdot m_{i,j}|+|1-D((I_{src}*k)\downarrow _s)| (4) argmin(Isrck)sIsrcs1+1ki,j+ki,jmi,j+1D((Isrck)s)(4)

( I s r c ∗ k ) ↓ s (I_{src}*k)\downarrow _s (Isrck)s表示利用核k进行降采样的LR图像, I s r c ↓ s I_{src}\downarrow _s Isrcs表示基于理想核进行降采样的LR图像。第二项为正则化项,第三项为边界惩罚项;
2)提取噪声:如果某个块的方差小于设定的阈值,则将其纳入到降质池中。这个规则可以描述为 σ ( n i ) < v ( 7 ) \sigma(n_i) \lt v (7) σ(ni)<v7;
4)RealSR降质算法:
在这里插入图片描述

Perceptual Extreme Super Resolution Network with Receptive Field Block

  • 论文链接:https://arxiv.org/abs/2005.12597
  • 代码:暂未开源
  • CVPR2020, NTIRE2020 感知极限超分赛道冠军
  • 网络结构(基于ESRGAN):
    在这里插入图片描述
    1)RRDB模块在这里插入图片描述
    2)RRFDB模块
    在这里插入图片描述
    3)RFB模块
    在这里插入图片描述
    关注不同层次的细节,且减少运算量和参数量;
    4)上采样模块
    在这里插入图片描述
    最近邻插值法上采样关注空间的特征转换,亚像素层关注depth-to-space,两者交替结合效果更好;
    5)训练时,先PSNR-oriented训练,将其作为预训练模型,然后添加内容损失和对抗损失进行微调;
    6)最终采用网络插值,取在测试集上最好的十个模型进行网络集成

PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of Generative Models

  • 论文链接:https://arxiv.org/pdf/2003.03808.pdf
  • 项目代码:https://github.com/adamian98/pulse
  • CVPR2020
  • 网络结构:
    1)网络是styleGAN;
    2)生成器生成 1024 × 1024 1024\times1024 1024×1024的人脸图像,然后对生成的人脸图像进行32倍bicubic降采样,与真实的LR图像做 l 2 l_2 l2loss,生成一张图像时,进行100次微调,使得生成图像降采样后和原始的LR图像相似;(训练过程的代码还未公开,训练的一些步骤我现在还不清楚,跟进后再补充)

Guided Frequency Separation Network for Real-World Super-Resolution

  • 论文链接:https://openaccess.thecvf.com/content_CVPRW_2020/papers/w31/Zhou_Guided_Frequency_Separation_Network_for_Real-World_Super-Resolution_CVPRW_2020_paper.pdf
  • 代码工程:https://github.com/fzuzyb/2020NTIRE-Guided-Frequency-Separation-Network-for-RWSR
  • 网络结构:
    在这里插入图片描述
  • 分两个阶段,第一阶段:无监督数据生成(通过HR图像生成LR图像,gan);第二阶段:监督SR(基于第一阶段生成的成对LR-HR图像进行训练);
  • 基于DSGAN的改进;
  • 第一阶段的gan网络,生成器的主要单元为CARB(Color Attention Residual Block),其中AdaIN的使用使得能够控制color shift,生成器的输入为bicubic将采用的HR图像块,生成器及判别器细节如下所示:
    在这里插入图片描述
    在这里插入图片描述
    生成器损失函数: L G = λ t 1 ∗ L l o w + λ t 2 ∗ L p e r + λ t 3 ∗ L h i g h L_G=\lambda_{t1}*L_{low}+\lambda_{t2}*L_{per}+\lambda_{t3}*L_{high} LG=λt1Llow+λt2Lper+λt3Lhigh
    其中:
    在这里插入图片描述
    F L ( ) F_L() FL()表示高斯低通滤波器;
    在这里插入图片描述
    在这里插入图片描述
    判别器损失函数定义:
    在这里插入图片描述
  • 第二阶段:利用前一阶段的网络生成LR图像,构成LR-HR图像对,然后基于LSGAN进行训练,判别器分为高低频提取特征,细节如下:
    在这里插入图片描述
    此阶段的生成器损失函数除了对抗损失和 l 1 l_1 l1损失外,另添加了边缘损失:
    在这里插入图片描述
    其中 F E F_E FE表示Canny边缘检测器。

Closed-loop Matters: Dual Regression Networks for Single Image Super-Resolution

  • 论文链接:https://arxiv.org/abs/2003.07018

  • 代码工程:https://github.com/guoyongcs/DRN

  • 网络结构:
    在这里插入图片描述
    在这里插入图片描述

  1. 图中黑色箭头是正向网络,先降采样提取特征再超分,红色箭头为对偶网络,从得到的超分图像中退质出低分图像;
  2. loss函数:引入额外的对偶回归Loss:
    在这里插入图片描述
    L p ( ) L_p() Lp()是多个尺度图像的loss;
    在没有成对数据集时,采用半监督学习,引入部分的成对数据集用于训练,整体损失函数为:
    在这里插入图片描述
  3. 1 S p ( x i ) 1_{Sp}(x_i) 1Sp(xi)表示当 x i x_i xi输出成对数据集时,该函数等于1,反之等于0。
    训练策略:
    在这里插入图片描述

Dual Super-Resolution Learning for Semantic Segmentation

  • 论文链接:论文
  • 代码工程:https://github.com/wanglixilinx/DSRL
  • 网络结构:
    在这里插入图片描述
    1)将超分用于语义分割,构成多任务网络结构;
    2)包括三大模块:语义分割超分(SSSR,网络结构图的上分支),单幅图像超分(SISR,网络结构图的下分支),特征相似度(FA,网络结构图的中间部分);
    3)特征相似度计算表达式为:
    在这里插入图片描述
  1. 最终的loss函数:
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29208.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【论文笔记】Exploring Temporal Coherence for More General Video Face Forgery Detection

* Exploring Temporal Coherence for More General Video Face Forgery Detection 题目&#xff1a;探索更一般的视频人脸伪造检测的时间相干性 1.概述 时间相干性网络组成&#xff1a; 第一阶段是一个全时间卷积网络&#xff08;FTCN&#xff09;。FTCN的关键见解是 将空间卷…

视频超分辨率论文笔记

持续更新 Video Super-Resolution via Deep Draft-Ensemble Learning 论文链接&#xff1a;http://openaccess.thecvf.com/content_iccv_2015/papers/Liao_Video_Super-Resolution_via_ICCV_2015_paper.pdf代码&#xff1a;http://www.cse.cuhk.edu.hk/leojia/projects/DeepS…

【超分辨率】SRCNN论文笔记

论文名称&#xff1a;Image Super-Resolution Using Deep Convolutional Networks 论文下载地址&#xff1a;https://arxiv.org/pdf/1501.00092.pdf 翻译参考&#xff1a;https://blog.csdn.net/PPLLO_o/article/details/90040801 1.论文概述 1.SRCNN算是深度学习在图像超分辨…

版面分析:[ICCV2017] Fast CNN-based document layout analysis

论文链接&#xff1a;https://openaccess.thecvf.com/content_ICCV_2017_workshops/papers/w18/Oliveira_Fast_CNN-Based_Document_ICCV_2017_paper.pdf 自动文档布局分析是认知计算和从文档图像中提取信息的过程中的关键步骤&#xff0c;如特定领域知识数据库创建、图形和图像…

论文笔记之数据增广(1):mixup

mixup&#xff1a;BEYOND EMPIRICAL RISK MINIMIZATION 文章&#xff1a;https://arxiv.org/pdf/1710.09412.pdf 代码&#xff1a;github 作者&#xff1a;张宏毅 mixupBEYOND EMPIRICAL RISK MINIMIZATION 摘要背景 引入贡献 方法 公式理解 实验讨论 摘要 如今大规模深度…

【图像超分辨率重建】——EnhanceNet论文精读笔记

2017-EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis(EnhanceNet) 基本信息 作者&#xff1a; Mehdi S. M. Sajjadi Bernhard Scholkopf Michael Hirsch 期刊&#xff1a; ICCV 引用&#xff1a; * 摘要&#xff1a; 单一图像超分辨率是指从…

旷视CVPR2019图卷积多标签图像识别Multi-Label Image Recognition with Graph Convolutional Networks论文详解

背景&#xff1a;GCN刚出来&#xff0c;很多很容易想到的idea会被运用起来&#xff0c;很容易产生一些paper。我们解析此篇论文&#xff0c;了解其中原理&#xff0c;一来看看如何将图卷积应用于目前技术上&#xff0c;二来看到底如何快速的把准确率刷到state of the art以便发…

Hierarchical Modular Network for Video Captioning【论文阅读】

Hierarchical Modular Network for Video Captioning 发表&#xff1a;CVPR 2022代码&#xff1a;HMNidea&#xff1a;现有方法在有监督学习的框架下比较生成句子与标注&#xff0c;没有对语义有详尽的探索。基于此&#xff0c;作者考虑从三个层面来连接视频特征和语义&#x…

CVPR2019超分辨率文章:Meta-SR,任意输入upsample factor的超分辨率网络

论文地址 CVPR2019的新文章&#xff0c;主要是针对以前超分辨率问题中需要固定上采样因子的问题作出的改进。 摘要 随着DNN的发展&#xff0c;超分辨率技术得到了巨大的改进。但是&#xff0c;超分辨率问题中的任意scale factor问题被忽视了很久。前面的很多工作都是把不同s…

GAIDC大会:飞桨邀你来大模型技术与应用论坛

深度学习大规模预训练模型的兴起&#xff0c;以其极强的通用能力和突破性的效果&#xff0c;正推动通用人工智能&#xff08;AGI&#xff09;快速发展&#xff0c;并带来了AI研发应用新范式&#xff0c;逐步改变AI生态格局。近期以大规模语言模型为基础的技术工作&#xff0c;展…

人工智能大模型多场景应用原理解析

​强烈推荐一个大神的人工智能的教程&#xff1a;http://www.captainai.net/zhanghan 前言 在上篇文章《人工智能大模型之ChatGPT原理解析》中分享了一些大模型之ChatGPT的核心原理后&#xff0c;收到大量读者的反馈&#xff0c;诸如:在了解了核心原理后想进一步了解未来的发展…

3日行程安排

22号 13&#xff1a;30出发到峡山码头坐船--横山岛景区 峡山码头 船费&#xff1a;来回70r 固定开船时间&#xff1a;9:30&#xff0c;12:00&#xff0c;14:00 或者&#x1f235;️12人自动开船&#xff0c;最晚4点有船返回 岛上风景 逛山海“小普陀”寺庙普南禅院,被誉为宁…

托福备考经验心得

综述 托福备考准备经验与心得。全部都是个人的反思&#xff0c;带有个人的观点色彩&#xff0c;按需自取即可。首先是几个深刻的经验教训&#xff1a; 对备考的强度要有一个基本的把握&#xff0c;之前一方面在忙别的事情一方面备考感觉自己成效不是特别明显 (可能是我本人能…

初识托福TOEFL口语

对于想要准备托福的童鞋&#xff0c;并不怎么了解托福考试内容的可以看一看&#xff0c;本文主要给大家分享下托福考试中口语部分介绍。 托福考试中总共有4个部分&#xff0c;第一个部分是Reading&#xff08;阅读&#xff09;&#xff0c;第二个部分是&#xff08;Listening&…

chatgpt赋能Python-pycharm自动纠错

Pycharm自动纠错&#xff1a;提高开发效率&#xff0c;减少犯错 随着Python语言的流行&#xff0c;Pycharm成为了众多Python工程师的首选IDE之一。Pycharm具有丰富的功能&#xff0c;其中之一就是自动纠错。本文将介绍Pycharm自动纠错的优点和如何正确使用它来提高开发效率&am…

KFC - VME = 50

KFC - VME 50 CalHeightFromPointToPlane.java_spencer_tseng的博客-CSDN博客

kfc 商家地址获取

简单获取商家地址(kfc) 学习源址 基本的查找url&#xff0c;请求方式我也是在上面的链接中学到的&#xff0c;在此就不赘述了&#xff0c;只是重点分享和记录一下自己遇到的一些bug 代码 import requestsurl http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opkeyw…

java实现kfc点餐系统

一、题目分析 1.1、题目要求 正常餐品结算和找零。基本套餐结算和找零。使用优惠劵购买餐品结算和找零。可在一定时间段参与店内活动&#xff08;自行设计或参考官网信息&#xff09;。模拟打印小票的功能&#xff08;写到文件中&#xff09;。 基本要求&#xff1a;程序设计风…

html网页肯德基设计代码作业,Illustrator设计一幅肯德基广告单页制作教程

给各位Illustrator软件的使用者们来详细的解析分享一下设计一幅肯德基广告单页的制作教程。 教程分享&#xff1a; 首先来看一下最终效果图&#xff1a; 本幅广告页面我们很常见&#xff0c;就是一幅肯德基广告页面。在现实生活中&#xff0c;同学可以细心观察身边的事物&#…

kfc扫描点餐系统java_Java实现KFC点餐系统过程解析

这篇文章主要为大家详细介绍了java实现KFC点餐系统&#xff0c;模拟肯德基快餐店的收银系统&#xff0c;具有一定的参考价值&#xff0c;感兴趣的小伙伴们可以参考一下 同学们应该都去麦当劳或肯德基吃过快餐吧&#xff1f;请同学们参考肯德基官网的信息模拟肯德基快餐店的收银…