多焦点图像融合文献学习(一)

本文介绍的是一篇明为"A convolutional neural network-based conditional random field model for structured multi-focus image fusion robust to noise."的文献,主要包括文献的摘要、前言摘选、主要贡献、网络结构、实验结果及结论等方面。

    • 文献名称
    • 摘要
    • 前言摘选
    • 主要贡献
    • 主要模块(策略)
      • A. 一元项与一元网络
      • B.光滑项与光滑网络
    • 网络结构
    • 实验
    • 结论

文献名称

在这里插入图片描述
一种基于卷积神经网络的抗噪声结构多焦点图像融合条件随机场模型
Bouzos, Odysseas, Ioannis Andreadis, and Nikolaos Mitianoudis. “A convolutional neural network-based conditional random field model for structured multi-focus image fusion robust to noise.” IEEE Transactions on Image Processing (2023).

摘要

在这里插入图片描述
不标准翻译
摘要——光学透镜有限的景深,使得多焦点图像融合(MFIF)算法至关重要。最近,卷积神经网络(CNN)已被广泛用于MFIF方法,但它们的预测大多缺乏结构并且受到感受野大小的限制。此外,由于图像具有由各种来源引起的噪声,因此需要开发对图像噪声具有鲁棒性的MFIF方法。本文介绍了一种新的基于条件随机场的抗噪声卷积神经网络(mf-CNNCRF)模型。该模型利用了CNN网络的输入和输出之间的强大映射以及CRF模型的长距离交互,以实现结构化推理。一元项和光滑项的丰富先验都是通过训练CNN网络来学习的。这个𝛼-扩展图切割算法用于实现MFIF的结构化推理。引入了一个新的数据集,其中包括干净和有噪声的图像对,并用于训练两个CRF项的网络。还开发了微光MFIF数据集,以演示相机传感器引入的真实噪声。定性和定量评估证明,对于干净和有噪声的输入图像,mf-CNNCRF优于最先进的MFIF方法,同时在不需要噪声先验知识的情况下对不同的噪声类型更具鲁棒性

前言摘选

在这里插入图片描述
多焦点图像融合(MFIF)算法可用于通过将以不同焦点设置捕获的多个输入图像合并到具有扩展景深的单个融合图像中来处理光学透镜的有限景深问题融合的图像应当具有比每个输入图像更高的视觉质量,而不会在融合期间引入伪影。此外,由于真实世界的图像包含噪声,例如传感器噪声和量化噪声,因此对不同噪声类型具有鲁棒性的MFIF方法是重要的。
现有方法主要可分为四大类:可变换域方法、空间域方法、组合方法和深度学习方法

在这里插入图片描述

基于变换域的MFIF方法使前向变换以将输入图像分解为各自的图像转换域表示,然后将其与定制的手工制作和预定义的融合规则进行融合。最后,对融合后的变换系数进行逆变换,得到最终的融合图像。由于融合图像的质量在很大程度上受到变换域选择和融合规则手动设计的影响,因此引入了大量基于变换域的MFIF算法。
在这里插入图片描述
最后,由于大多数基于变换域的MFIF方法都不是移位不变的,因此在输入图像中可能会发现由于动态场景导致配准错误或相机抖动,将导致融合中的可见伪影图像

在这里插入图片描述
空间域MFIF方法中,融合图像被估计为输入图像的加权平均值。基于所采用的活动水平估计,构建权重图并用于融合输入图像。空间域方法,可以根据用于活动水平估计的方法分类为基于块、基于区域和基于像素。在基于块的方法中,将输入图像分解为固定大小的块,并使用整个块的活动水平估计来构建权重图块的大小在很大程度上影响融合图像的质量

在这里插入图片描述
基于空间域的MFIF方法的一个主要缺点是它们对图像噪声的敏感性

为了保持变换域和空间域的优势,出现了基于组合的MFIF方法。组合方法可能比变换域和空间域方法执行得更好。

在这里插入图片描述

传统MFIF方法的性能受到手工制作的特征和人工设计的融合规则的限制,无法完全模拟MFIF问题的复杂性。这导致基于深度学习的MFIF方法越来越受欢迎。基于深度学习的方法不需要手工设计用于焦点测量的特征,也不需要手动设计融合规则,这使得它们可能产生比传统MFIF方法更高质量的融合图像

在这里插入图片描述
对MFIF的深度学习方法进行了广泛的研究,并将其分为两大类基于决策图的方法和端到端方法

  1. 基于决策图的方法:在基于决策图方法中,网络根据输入图像的活动水平预测决策图。然后,通常应用后处理方法来细化预测的决策图。最后,使用最终决策图来指导输入图像的融合。
    在这里插入图片描述
  2. 端到端:在端深度学习MFIF方法中,使用回归优化来训练网络,以学习输入图像和目标图像之间的映射,而不需要预测决策图的中间步骤。

在这里插入图片描述

为了结合基于深度学习的方法和CRF图的优点,同时克服它们各自的局限性,引入了基于CNN的CRF模型,命名为MFIF的mf-CNNCRF

主要贡献

在这里插入图片描述
与上述CRF模型的应用相比,所提出的mf-CNNCRF框架非常不同。最重要的是,一元先验和平滑先验都是通过端到端训练的CNN架构来估计的。因此,开发了更适合MFIF的、更好地描述输入图像和目标图像之间的映射的丰富先验。预测的一元先验和平滑先验为CRF模型提供了补充信息,以便通过解决具有𝛼-扩展[50],它是基于图切割的。所提出的mf-CNNCRF方法是一种基于决策图的方法。
在这里插入图片描述

  1. 所提出的mf-CNNCRF模型结合了CNN网络的输入输出之间复杂映射和CRF模型的长距离交互的优点,从而在不需要进一步后处理的情况下实现MFIF的结构化推理。UnaryNet和SmoothnessNet都是使用低复杂度的CNN架构¬进行端到端训练的高效siamese网络,以便为MFIF学习丰富的复杂先验。这两种网络都为处理任意问题提供了相当大的速度𝑁 输入图像并支持输入图像的交换性。
  2. 所提出的mf-CNNCRF模型是在一个新的合成MFIF数据集上训练的,该数据集包含干净的图像和被高斯噪声、椒盐噪声和泊松噪声污染的图像。所提出的损失函数和所提出的数据集用于训练一元项和平滑项,使mf-CNNCRF对不同的噪声类型具有鲁棒性,而不需要关于¬输入图像的噪声特性的先验知识。因此,mf-CNNCRF对干净的输入图像和包含不同类型噪声的输入图像都具有很强的泛化能力。
    3) 与之前的工作mf-CRF[24]相比,所提出的能量最小化方法的主要新颖之处在于使用CNN网络来对输入/输出的复杂关系进行建模,而之前的工作使用精心手工制作的先验来对一元和平滑项进行建模,以解决多焦点图像融合问题。
    4)由于SmoothnessNet导致成对平滑先验,因此可以使用高效的成对解算器,而不是会增加复杂性的高阶CRF解算器。

不标准翻译
在这里插入图片描述

主要模块(策略)

在这里插入图片描述
在这里插入图片描述

不标准翻译
所提出的MFIF框架是基于决策图的,对于决策图D中的每个位置,我们在CRF图中创建一个节点。CRF图中的成对连接是通过将每个节点连接到位于N8邻域中的各个节点而形成的。一元势函数U和成对势函数V都是用端到端训练的CNN来估计的。更准确地说,学习一元势函数U的“UnaryNet”和学习成对势函数V的“SmoothnessNet”使用有效的siamese架构。这些网络允许并行处理任意数量的输入图像N,为MFIF的两个项的估计提供了高的计算效率和加速度。UnaryNet和SmoothnessNet支持输入图像到框架的交换性,因为每个网络的分支共享相同的架构和相同的权重。CNN网络的使用允许学习丰富的一元势和平滑势。所提出的能量最小化方法利用了通过CNN网络学习到的丰富潜力和CRF模型的长距离相互作用,以实现全局或接近全局MFIF解决方案。
为了估计决策图的标签,我们使用以下能量最小化:
在这里插入图片描述

A. 一元项与一元网络

在这里插入图片描述

CNN网络称为UnaryNet’通过数据进行训练,以便学习概率P(En),即每个输入图像En应在空间位置n处对最终融合图像做出贡献。2演示了用于N个输入图像的暹罗网络的体系结构,用于估计概率P(e)。UnaryNet’是一种高效的暹罗体系结构,使用N个分支等于N个输入图像的数量。每个分支以N个输入图像中的一个作为输入,而每个分支的输出被传递到决策层。一个N路softmax函数被用作决策层,以预测概率P(E,)。UnaryNet’的高效连体结构支持N个图像的估计计算效率。最后,并行处理的概率P(Ln)将一元势U(ln)估计为预测概率P(ln)的负对数似然。
在这里插入图片描述
UnaryNet的分支共享相同的架构和相同的权重。每个分支都是一个包含三个分支的ConvNet架构。ConvNet的第一个分支由滤波器大小【3x3x1x16】的卷积层和ReLu组成。接下来的两个卷积层有过滤器的大小[3x3x16x16],每一层都是被ReLu所轻视。ConvNet分支卷积层的最后一个具有过滤器大小【3x3x16x1】。在第二个分支中,第一个卷积层是水平轴上的Sobel梯度卷积滤波器3x3,然后是滤波器尺寸为【3x3】的卷积层第十六次然后是ReLu,2个具有滤波器尺寸3x3x16x16】的卷积层,然后是ReLu和一个具有滤波器尺寸【3x3x16x1】的卷积层。在第三分支中,第一卷积层是垂直轴上的Sobel梯度卷积滤波器3x3,接着是具有滤波器尺寸【3x3x1x16】的卷积层,接着是ReLu,具有滤波器尺寸【3x3x16x16】的2个卷积层,接着是ReLu和具有滤波器尺寸【三乘三乘十六乘一】。最后,深度拼接层用于收集所有三个分支的输出,带滤波器的卷积层【3x3x3x1】用于提取给定输入图像的最终输出。
在这里插入图片描述
在这里插入图片描述

通过数据训练UnaryNet,以学习的概率有效地通过损失函数最小化。UnaryNet的两个分支用于训练网络对输入图像的权重。这两个分支共享相同的架构和相同的权重。UnaryNet学习的概率依赖于输入图像和目标图像之间的像素强度的距离和像素特征的距离。对于与目标图像的像素和边缘相似的像素和边缘,学习较高的概率,而对于与各自的目标图像不同的像素和边缘,则学习较低的概率。UnaryNet的一个主要优势是概率不是手工生成的,而是由网络学习的,网络是端到端训练的。

所提出的损失函数允许网络学习与像素强度的距离和输入图像与目标图像之间的距离成正比的概率。损失函数是基于像素的,以便在聚焦和失焦像素的边界附近具有更好的精度。

B.光滑项与光滑网络

在这里插入图片描述

平滑项的目标Vpq是在属于聚焦-离焦像素边界的相邻像素p、q之间分配较低的成对代价,从而分配给可能属于同一输入图像的相邻像素p、q之间的更高的成对代价。为了预测决策图N8邻域中相邻像素p、q之间的标签兼容性,对“SmoothnessNet”进行了训练。训练“SmoothnessNet”以将高概率P(lp=l)分配给可能属于相同输入图像的相邻像素p,q并将高概率P(lp#l,)分配给可能属于不同输入图像的像素,从而分配给图割解决方案。
SmoothnessNet是一个有效的连体结构,允许任意N个图像的所有M输入图像组合,并行处理,以预测每个标签组合LP,lqe【1,N】相邻像素p,q之间的标签兼容性。
图3演示了用于预测两个输入图像和所有四个标签组合的标签兼容性概率的SmoothnessNet体系结构SmoothnessNet的每个分支以i,je1,N】的M个级联图像对组合中的一个作为输入,其中N是输入图像的总数。SmoothnessNet的分支共享相同的体系结构和权重。每个分支由五个卷积层组成。更精确地说,第一个卷积层有滤波器【3x3x2x16】,然后是tanh,接下来的三个卷积层有滤波器【3x3x16x16】,每个卷积层后面都是tanh
在这里插入图片描述
在这里插入图片描述
SmoothnessNet预测N8邻域内相邻像素之间的所有成对权值。两两权值是通过处理一个大邻域中的像素来估计的,这相当于光滑网络的接收域,然而,使用成对权值可以使带成对求解器的有效图解被用于代替高阶邻域的图割求解器建议的平滑网络架构的另一个主要优点是使用高效的连体结构,它允许许多输入图像同时进行处理,从而最终的平滑概率。

网络结构

在这里插入图片描述

*不标准翻译*

实验

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

在这里插入图片描述

提出了一种基于cnn的多聚焦图像融合crf模型mf-cnn crf。该方法利用CNN训练得到的丰富的先验势和CRF模型的长距离相互作用,实现了多聚焦图像融合的全局或接近全局的结构化推理。建议的框架使用高效的连体结构,以支持任意数量的输入图像,可以并行处理使mf-CNNCRF计算效率很高。开发的数据集包括干净的训练图像和训练图像与高斯噪声,盐和胡椒噪声和泊松噪声。实验结果表明,所提出的MF-CNNCRF方法在定性和定量评价高斯噪声、盐分噪声和泊松噪声图像方面均优于现有的MFIF方法,具有较高的泛化能力。需要注意的是,该算法不需要噪声类型或统计信息的知识。据我们所知,这是第一个使用CNN架构来学习丰富的CRF先验的工作。我们未来的工作将专注于优化UnaryNet和SmoothnessNet的网络架构,并使用基于深度学习的网络替换a-expansion算法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/289868.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

libVLC 捕获鼠标、键盘事件

在实现播放器的时候,我们需要捕获键盘、鼠标事件进行视频快进、快退,或者双击全屏/退出全屏窗口、鼠标右键弹出菜单栏。默认情况下,在使用libVLC库的时候,我们无法捕获这些事件,因为我们将Qt的视频窗口传递给了libVLC。…

Mybatis别名 动态sql语句 分页查询

给Mybatis的实体类起别名 给Mybatis的xml文件注册mapper映射文件 动态sql语句 1 if 2 choose 3 where 4 foreach 一&#xff09;if 查询指定名称商品信息 语法&#xff1a; SELECT * FROM goods where 11 <if test "gName!null"> and g.g_name like co…

C++之移动语义与智能指针

目录 移动语义 1、几个基本概念的理解 2、复制控制语义的函数 3、移动控制语义的函数 3.1、移动构造函数: 3.2、移动赋值函数 4.区别 5、std::move函数 6.代码演示: 资源管理与智能指针 一、C语言中的问题 二、C的解决办法(RAII技术)&#xff1a; 三、四种智能指针…

<el-table>设置一列为固定字段,其他列为循环生成

<el-table :data"tableData" style"width: 100%"><el-table-columnprop"name"label"固定字段名":formatter"formatter"></el-table-column><el-table-columnv-for"(item, index) in wordsColumns…

echarts 3D示例 echart, echarts-gl

echarts官网有很多的炫酷的3D模型 来尝试实现下&#xff0c;使用原本的柱状图或者折线图代码创建echarts示例,使用cdn的方式引入echarts <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewp…

XUbuntu22.04之激活Linux最新Typora版本(二百二十五)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…

element-ui 自定义点击图标/文本/按钮触发el-date-picker时间组件,不使用插槽

天梦星服务平台 (tmxkj.top)https://tmxkj.top/#/ 1. 图片预览 2.上代码 2.1html <el-button class"hide_input" size"small"><svg t"1711608996149" class"icon" viewBox"0 0 1024 1024" version"1.1"…

macOS 13 Ventura (苹果最新系统) v13.6.6正式版

macOS 13 Ventura是苹果电脑的全新操作系统&#xff0c;它为用户带来了众多引人注目的新功能和改进。该系统加强了FaceTime和视频通话的体验&#xff0c;同时优化了邮件、Safari浏览器和日历等内置应用程序&#xff0c;使其更加流畅、快速和安全。特别值得一提的是&#xff0c;…

原型链-(前端面试 2024 版)

来讲一讲原型链 原型链只存在于函数之中 四个规则 1、引用类型&#xff0c;都具有对象特性&#xff0c;即可自由扩展属性。 2、引用类型&#xff0c;都有一个隐式原型 __proto__ 属性&#xff0c;属性值是一个普通的对象。 3、引用类型&#xff0c;隐式原型 __proto__ 的属…

二维双指针,滑动窗口

二维双指针 思路&#xff1a;考虑暴力做法&#xff0c;我们统计前缀和&#xff0c;然后枚举以 ( x 1 , y 1 ) (x_1,y_1) (x1​,y1​), ( x 2 , y 2 ) (x_2,y_2) (x2​,y2​)为左上&#xff0c;右下顶点的矩阵有多少是合法的&#xff0c;那么&#xff0c;这样的时间复杂度为 n 4…

纯分享万岳外卖跑腿系统客户端源码uniapp目录结构示意图

系统买的是商业版&#xff0c;使用非常不错有三端uniapp开源代码&#xff0c;自从上次分享uniapp后有些网友让我分享下各个端的uniapp下的各个目录结构说明 我就截图说以下吧&#xff0c;

怎样去保证 Redis 缓存与数据库双写一致性?

解决方案 那么我们这里列出来所有策略&#xff0c;并且讨论他们优劣性。 先更新数据库&#xff0c;后更新缓存先更新数据库&#xff0c;后删除缓存先更新缓存&#xff0c;后更新数据库先删除缓存&#xff0c;后更新数据库 先更新数据库&#xff0c;后更新缓存 这种方法是不推…

基于单片机技术的门禁系统硬件设计研究

摘要:门禁系统在工业领域的应用十分广泛,如何利用单片机技术对门禁系统中的硬件进行管理与控制已经成为相关单位十分重要的研究课题之一。因此,文章设计了一套基于单片机技术的门禁系统硬件方案,旨在充分发挥单片机设备在自动化控制方面的优势,提高门禁系统的自动化水平。…

Uibot6.0 (RPA财务机器人师资培训第5天 ) 报销汇总机器人案例实战

训练网站&#xff1a;泓江科技 (lessonplan.cn)https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https://laiye.lessonplan.cn/list/ec0f5080-e1de-11ee-a1d8-3f479df4d981https…

企业网站建设的方法的相关问题的解决办法的问题

现在市场上比较大的公司都建立了自己的企业网站&#xff0c;比如华为、小米等&#xff0c;在他们的企业网站中&#xff0c;可以充分展示自己产品的优势&#xff0c;介绍公司的优质服务。 这都是让顾客改变购买想法的重要因素。 现在互联网发达了&#xff0c;很多人在购买产品的…

Linux内核之最核心数据结构之一:struct file(三十)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…

使用脚本自动同步时间(在 Windows 7/8/10/11 中)

你可以使用使用 w32tm 命令的批处理脚本来同步 Windows上的时间。 这是一个用于同步时间的简单批处理脚本&#xff1a; echo off echo 正在同步时间... w32tm /resync echo 时间同步完成。将以上代码保存在扩展名为.bat的文本文件中&#xff0c;例如sync_time.bat。 然后&…

推动制药行业数字化转型:基于超融合架构的MES一体机解决方案

随着中国对信息化重视程度的不断加深&#xff0c;制药行业作为国民经济的重要支柱之一&#xff0c;也在积极寻求通过数字化手段提升产业效率与产品质量。自党的十六大提出“以信息化带动工业化”的战略以来&#xff0c;制药业的这一转型探索尤为迫切。 在现代制药生产中&#…

Svg Flow Editor 原生svg流程图编辑器(四)

系列文章 Svg Flow Editor 原生svg流程图编辑器&#xff08;一&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;二&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;三&#xff09; Svg Flow Editor 原生svg流程图编辑器&#xff08;四&#xf…

实时数仓之实时数仓架构(Hudi)

目前比较流行的实时数仓架构有两类&#xff0c;其中一类是以FlinkDoris为核心的实时数仓架构方案&#xff1b;另一类是以湖仓一体架构为核心的实时数仓架构方案。本文针对FlinkHudi湖仓一体架构进行介绍&#xff0c;这套架构的特点是可以基于一套数据完全实现Lambda架构。实时数…