(论文调研) Multi-task的网络结构 在图像去噪问题中的应用

1.SNIDER: Single Noisy Image Denoising and Rectification for Improving License Plate Recognition

这是一篇用于实现端到端的车牌恢复 (LPR: License Plate Recognition) 网络, 其中使用去噪和校正网络来生成清晰的恢复图像, 以实现稳健的 LPR 性能.
在这里插入图片描述
这个网络的名称为SNIDER, 将输入图像输入 SNIDER 进行图像恢复.

  • (b,c) SNIDER由主任务 (即DSN、RSN) 和辅助任务组成, 它们将低质量数据转换为高质量数据, 用于训练DSN、RSN和辅助任务网络.
  • (d,e) LPR网络用于测试并输出LPR结果, 即识别矫正后的车牌图像中的数字.
  • DSN通过编解码网络进行降噪处理, DSN生成的图像输入到RSN中进行矫正, 输出矫正后的车牌图像. 这里采用了两步的流程.
  • 辅助任务以提取主任务两个阶段的编码器末端的Feature map作为输入, 通过两个不同的解码器分别解码获得车牌字数与二值化结果.
  • 训练数据是将真实车牌进行缩放后差值复原 (加噪), 并且调整倾斜 (15°~30°) 后获取的.

>> 多任务与降噪结合的评价

将复杂的任务分解为多个网络组合的流程进行, 综上思路中降噪->矫正->LPR预测被分为明晰的多个步骤来进行, 属于串行的多任务.
而车牌数字数量预测和二值预测都属于并行的多任务组件, 可以理解为正则化的效果. 它们不直接预测的, 而是用于辅助网络认知.
而这个过程中将降噪任务作为必不可少的串行多任务组件部分来进行, 将降噪作为复杂任务的前导学习进行.

2.Test-time Adaptation for Real Image Denoising via Meta-transfer Learning

这篇文章的目的是提高真实图像去噪性能, 在多任务网络上实现测试时适应.
学习策略分为两个阶段, 第一阶段使用元辅助学习 (meta-auxiliary learning) 对网络进行预训练, 以获得更好的元初始化 (meta initialization).
同时,我们使用元学习 (meta-learning) 对网络进行微调 (元迁移学习) 作为训练的第二阶段,以实现对真实噪声图像的测试时间适应.

主体网络的架构如下:
在这里插入图片描述
给定一个噪声图像 I n I_n In作为输入, 多任务分支网络 f θ 1 f_{\theta_1} fθ1输出预测的干净图像 I ^ c \hat{I}_c I^c和预测的噪声图像 I ^ n \hat{I}_n I^n.
通过多个跳跃连接后首先生成的图像是一个残差图像 (3通道的).
残差图像与噪声图像 I n I_n In相加, 产生预测的图像为干净图像 I ^ c \hat{I}_c I^c.
可以发现, 这个多任务的输出并非是将两个图像并列输出 (即单纯多解码器结构), 而是先输出干净图像, 并且将干净图像与残差串联构成Auxiliary Head, 再度依靠生成Auxiliary Head特定噪声图像 I ^ n \hat{I}_n I^n. 即旧输出串联构造新输出.
此外, 网络的掩模生成分支 g θ 2 g_{\theta_2} gθ2还产生掩模 M M M (存噪点图像) 来调节重建损失 L Rec L_{\text{Rec}} LRec. 重建损失 L Rec L_{\text{Rec}} LRec将会作为辅助损失 L Auc L_{\text{Auc}} LAuc的一部分来调节多任务网络 f θ 1 f_{\theta_1} fθ1.
在这里插入图片描述
网络训练的过程可以用上图概述.

  • 首先, 网络使用元辅助训练, 将网络参数 θ 1 0 \theta^0_1 θ10, θ 2 0 \theta^0_2 θ20更新为 θ 1 T \theta^T_1 θ1T, θ 2 T \theta^T_2 θ2T. 这个过程会更新多任务网络 f θ 1 f_{\theta_1} fθ1和掩模生成网络 g θ 2 g_{\theta_2} gθ2. 采用的输入是合成的 {干净-噪声} 数据对. 这个过程提供了较好的元初始化, 实现更好的泛化性, 提高网络对各种合成噪声的鲁棒性.
  • 然后, 我们使用这个预训练网络作为元迁移学习的元初始化, 这个过程通过输入真实噪声数据集将参数从 θ 1 T \theta^T_1 θ1T, θ 2 T \theta^T_2 θ2T.更新为 θ 1 M \theta^M_1 θ1M, θ 2 M \theta^M_2 θ2M. 迁移学习只会训练Primary Head 和 Auxiliary Head.
  • 利用这两个阶段的学习, 我们希望使掩模生成网络产生更好的掩模, 这将有助于多任务网络在使用掩模重建损失进行训练时能够适应各种类型的噪声 (合成的和真实的).
  • 对于未见过的数据的测试数据集, 通过使用掩蔽重建损失来调整每个图像示例上的多任务网络的参数 (即零样本元学习), 该损失可以以自监督的方式进行训练, 而无需任何真实图像.

>> 多任务与降噪结合的评价

本文从两个地方利用的多任务的思路:
首先是网络会输出两个内容以作为不同的任务对象: 即干净图像噪声图像. 并值得一提的是, 作者通过设计了Primary Head 和 Auxiliary Head将两个任务又关联起来. 通过Primary Head输出干净图像, 这个过程类似去噪学习. 之后通过Auxiliary Head进一步利用基础网络 (Network body) 的残差干净图像的拼接输入到附属网络块来学习, 得到网络认知的预测噪声图像.
其次是通过一个掩模生成网络来作为"记录员"的身份记录噪声的特点, 它本身也可以作为一个正则化的附属子任务. 只不过它并非完全无用 (指的是并不是只为了辅助主任务训练来用) , 它还可以作为自监督的重要组件之一.

3. Multitask Learning for Super-Resolution of Seismic Velocity Model

这个网络是一种基于深度学习的超分辨率 (SR) 方法来增强地震速度模型的分辨率.
虽然这篇文章并没有明确为去噪任务, 但是分辨率提升的任务实际上转变为去噪的任务.
在这里插入图片描述

  • 网络左端的"Img"是附带低频信号的速度模型, 而X-grad与Y-grad分别表示通过Sobel算子获得的图像边缘信息.
  • 编解码的中间高维部分采用了DenseNet的Dense模块, 这种模块可以避免梯度消失问题并快速获得真实的SR结果.
  • 这个结构是通过硬参数共享实现的, 即并没有通过分离的组件 (多解码器或多编码器) 或 不同的网络结构软共享连接来实现不同的任务目标, 而是将任务一并拼接到通道中进行参数共享.
  • 边界恢复是当前SR处理的难点, 这在地震速度模型的SR中尤为突出, 这就是通过sobel算子引入边缘信息的目的. 实际工作中, 这部分可以引入不同噪声参数, 从而实现特定噪声去除.

>> 多任务与降噪结合的评价

这个模型着重讨论了硬参数共享的多任务在超分辨中的可行性, 虽然并没有融合去噪任务, 但是两个任务存在相似性, 有着相互联系的基础.
可以将不同的干扰情况下的图像与低分辨率图像一并作为同通道内的数据输入到网络中, 直接让网络内部的卷积学习通道彼此之间的关联.
实际上, 硬参数共享也可以作为软参数共享多任务的一个混合的子任务, 实现混合共享.

4. Joint Image Compression and Denoising via Latent-Space Scalability

这篇文章的模型内部组件结构略有复杂, 我还没深入去解析. 但是主体思想比较清晰.
这篇文章提出了一种基于学习的图像压缩框架, 其中联合执行图像去噪压缩 (任务为两个)
图像编解码器的潜在空间以可扩展的方式组织, 使得干净的图像可以从潜在空间的子集 (基础层) 解码, 而噪声图像以更高的比率从完整的潜在空间解码.
简单来说, 如果要构建一个既可以生成去噪图像又可以重建噪声图像的基于学习的系统时, 考虑首先压缩噪声图像, 然后解码, 然后应用去噪以获得去噪后的图像, 当然, 这种思路也可以乔迁到其他主任务中, 即在解码时考虑降噪问题.
在这里插入图片描述
其中, 首先压缩噪声图像, 然后解码, 之后应用去噪以获得去噪后的图像.
模型结构如图所示, 其中细节组件暂且不论, 但是就直观来是一个双解码的网络.
各解码器专注于在前导的编码高维信息中采用服务于特定任务的组件做特定的目标.

>> 多任务与降噪结合的评价

这个模型采用了宏观意义上的双解码器多任务结构, 但是又不同于单纯的端到端双解码器网络, 在每个编解码内部又有各异的组件.
这证明了多任务的编解码思想是灵活的, 同时, 这些灵活的构造依旧可以服务于去噪任务.
间接地, 这也证明多任务的设计也是灵活的.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/150725.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

知识图谱1_2——下载neo4j客户端

客户端下载 这里展现一种通过客户端进行操作的方法 https://neo4j.com/download/ 下载desktop客户端 填写完成后开始下载 下载完成后&#xff0c;在命令行输入 chmod x <文件名> #给予文件权限 sudo add-apt-repository universe #安装.appimage所需的包fuse&#x…

CSS点击切换或隐藏盒子的卷起、展开效果

<template><div class"main"><el-button click"onCllick">切换</el-button><transition name"slideDown"><div class"info" v-if"isShow">1111</div></transition></di…

【AI视野·今日Robot 机器人论文速览 第四十八期】Thu, 5 Oct 2023

AI视野今日CS.Robotics 机器人学论文速览 Thu, 5 Oct 2023 Totally 32 papers &#x1f449;上期速览✈更多精彩请移步主页 Daily Robotics Papers LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving Authors Hao Sha, Yao Mu, Yuxuan Jiang, Li…

select实现服务器并发

select的TCP服务器代码 #include <stdio.h> #include <unistd.h> #include <string.h> #include <sys/types.h> #include <sys/socket.h> #include <arpa/inet.h> #include <netinet/in.h> #include <sys/select.h> #include…

QChart使用说明

一.使用说明 Qt官网例程&#xff1a;https://doc.qt.io/qt-5/qtcharts-examples.html QChart&#xff1a;用于管理图表中的线、图例和轴的图形表示。可以简单理解为是一个画布。QChartView&#xff1a;视图组件&#xff0c;无法单独进行显示&#xff0c;需要依附其他组件进行…

SpringBoot的error用全局异常去处理

记录一下使用SpringBoot2.0.5的error用全局异常去处理 在使用springboot时&#xff0c;当访问的http地址或者说是请求地址输错后&#xff0c;会返回一个页面&#xff0c;如下&#xff1a; 这是因为请求的地址不存在&#xff0c;默认会显示error页面 但我们实际需要一个接口&a…

卷积神经网络的发展历史-VGG

VGG的产生 2014 年&#xff0c;Simonyan和Zisserman提出了VGG系列模型&#xff08;包括VGG-11/VGG-13/VGG-16/VGG-19&#xff09;&#xff0c;并在当年的ImageNet Challenge上作为分类任务第二名、定位&#xff08;Localization&#xff09;任务第一名的基础网络出现。 VGG的…

吃鸡达人必备!超实用干货激爽分享!

大家好&#xff01;作为一名专业吃鸡行家&#xff0c;今天我将为大家分享一些关于提高游戏战斗力和分享顶级游戏作战干货的秘诀&#xff0c;还有一些方便吃鸡作图、装备皮肤库存展示和查询的技巧&#xff01; 首先&#xff0c;让我们来介绍一些吃鸡作图工具推荐。无论是新手还是…

跨境电商系统对接-进口

一、跨境进口方式 1、一般贸易 指中国境内有进出口经营权的企业进行进出口贸易&#xff0c;货物到港后需要先清关&#xff08;办理海关申报、查验、征税、放行等手续&#xff09;&#xff0c;然后货主才能提货&#xff0c;一般贸易适合大批量进口商品&#xff0c;公司的鲜奶、…

ToBeWritten之改进威胁猎杀:自动化关键角色与成功沟通经验

也许每个人出生的时候都以为这世界都是为他一个人而存在的&#xff0c;当他发现自己错的时候&#xff0c;他便开始长大 少走了弯路&#xff0c;也就错过了风景&#xff0c;无论如何&#xff0c;感谢经历 转移发布平台通知&#xff1a;将不再在CSDN博客发布新文章&#xff0c;敬…

群晖搭建docker系统和办公服务2

首先先确认下我们的Office是否为VOL版&#xff0c;方法如下&#xff08;请您根据自身情况更改以下命令&#xff09;&#xff1a; 管理员身份运行命令提示符&#xff0c;输入 cd C:\Program Files\Microsoft Office\Office16 切换目录 &#xff08;这里请根据您自己的Office版本…

MySQL8 间隙锁在11种情况下的锁持有情况分析

测试环境及相关必要知识 测试环境为mysql 8 版本 间隙锁&#xff08;Gap Lock&#xff09;&#xff1a;用于锁定索引范围之间的间隙&#xff0c;防止其他事务在此间隙中插入新记录。间隙锁主要用于防止幻读问题。 在可重复读的隔离级别下默认打开该锁机制&#xff0c;解决幻…

Dubbo3应用开发—Dubbo3注册中心(zookeeper、nacos、consul)的使用

Dubbo3注册中心的使用 zookeeper注册中心的使用 依赖引入 <dependency><groupId>org.apache.dubbo</groupId><artifactId>dubbo-dependencies-zookeeper-curator5</artifactId><version>${dubbo.version}</version><type>p…

Vue中如何进行分布式日志收集与日志分析(如ELK Stack)

在Vue中实现分布式日志收集与日志分析&#xff08;使用ELK Stack&#xff09; 日志收集和分析在现代应用程序中是至关重要的&#xff0c;它们可以帮助开发人员监视和诊断应用程序的行为&#xff0c;从而提高应用程序的稳定性和性能。ELK Stack&#xff08;Elasticsearch、Logs…

ping使用

使用shell ping一个网段 #!/bin/shfor ib in $(seq 1 254); doip"192.168.1.$ib"(if ping -c3 "$ip" >> 1.txt; thenecho "$ip is alive"fi) &done wait在每次循环的最后&#xff0c;使用 & 将子 shell 放入后台执行&#xff0c…

基于FPGA的图像形态学腐蚀算法实现,包括tb测试文件和MATLAB辅助验证

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 将FPGA的仿真结果导入到MATLAB,结果如下所示&#xff1a; 2.算法运行软件版本 vivado2019.2 matlab2022a 3.部分核心程序 timescale 1ns / 1ps…

【IR】按键

一、修改按键快速检查 1、修改ir.c已有按键功能快速验证: 如: 2、make customers 3、在根目录 cvte_build/resource/irkeycode下(这个是NEC协议的,其他协议也是一个道理,替换对应的tab就行了) remote_nec_irfac.tab是CVTE工厂遥控 remote_nec_ircus1.tab是客户遥控…

【prism】prism 框架代码

前言 这个是针对整个专栏的一个示例程序,应用了专栏里讲的一些知识点,他是一个小而美的Prism的框架代码,一个模板,方便大家去扩展一个prism工程。 下面是一些代码片段,最后我给出整个工程的下载链接~~~ 代码片段 主界面代码 <Window x:Class="PrismTest.Views…

数百个下载能够传播 Rootkit 的恶意 NPM 软件包

供应链安全公司 ReversingLabs 警告称&#xff0c;最近观察到的一次恶意活动依靠拼写错误来诱骗用户下载恶意 NPM 软件包&#xff0c;该软件包会通过 rootkit 感染他们的系统。 该恶意软件包名为“node-hide-console-windows”&#xff0c;旨在模仿 NPM 存储库上合法的“node-…

云服务器CVM_云主机_云计算服务器_弹性云服务器-腾讯云

腾讯云服务器CVM提供安全可靠的弹性计算服务&#xff0c;腾讯云明星级云服务器&#xff0c;弹性计算实时扩展或缩减计算资源&#xff0c;支持包年包月、按量计费和竞价实例计费模式&#xff0c;CVM提供多种CPU、内存、硬盘和带宽可以灵活调整的实例规格&#xff0c;提供9个9的数…