28、论文阅读:基于像素分布重映射和多先验Retinex变分模型的水下图像增强

A Pixel Distribution Remapping and Multi-Prior Retinex Variational Model for Underwater Image Enhancement

  • 摘要
  • 介绍
  • 相关工作
    • 基于模型的水下图像增强方法:
    • 无模型水下图像增强方法:
    • 基于深度学习的水下图像增强方法:
  • 论文方法
    • 概述
    • 像素分布重映射(PDR)模块
      • 1、像素预补偿
      • 2、通道拉伸
      • 3、像素分布重映射
    • 多先验亮度补偿(MPLC)模块

Retinex Variational Model for Underwater Image Enhancement)

摘要

高质量的水下成像对水下探索至关重要。然而,由于海水的颗粒散射和光吸收,图像清晰度显著降低。为了解决这些问题,我们提出了一种结合像素分布重映射(PDR)和多优先级Retinex变分模型的新型水下图像增强(UIE)方法。我们设计了一种针对严重衰减通道的预补偿方法,有效防止了颜色校正过程中产生新的颜色伪影。通过结合通道间的耦合关系,我们计算了一个限制因子,用于重映射像素分布曲线以提高图像对比度。此外,考虑到显著的噪声干扰,我们在构建变分模型时引入了先验知识,包括水下噪声和纹理先验,并设计了符合水下特征的惩罚项,以去除反射分量中的过多噪声。我们的方法通过快速求解器高效地解耦了光照和反射分量。随后,利用伽马校正调整光照分量,并融合校正后的光照和反射分量,重建出最终自然的输出图像。通过对各种数据集的全面评估,我们的方法显著超越了当前的最新技术(SOTA)方法。结果表明,我们的方法在纠正颜色偏差和补偿水下图像的亮度损失方面具有良好的效果。

介绍

在这里插入图片描述
在这里插入图片描述
【强衰减通道补偿对颜色校正的结果。(a)-(f)中的顶行示出了没有补偿强衰减的颜色校正结果,导致显著的伪像。底行展示了在我们的方法对强衰减通道进行补偿之后的增强结果。】

清晰的水下图像是探索海底资源、水体污染监测和广泛科学研究的基本前提。因此,获得清晰的水下图像已成为一个重大挑战 [1], [2], [3]。然而,由于水下环境的复杂性和光照条件的变化,水下图像可能由于光衰减和悬浮颗粒散射而面临颜色失真、亮度损失和对比度低的问题 [4], [5], [6]。因此,各种方法已被探索以应对分析水下图像的挑战。

图1(b) 表明,不同光波长在水中衰减率不同。较长的波长,如红光,衰减得更快,而较短的波长,如蓝光,衰减较慢。这种衰减差异通常给水下图像带来蓝绿偏色,正如以往研究 [7] 所讨论的。传统的颜色偏差校正方法通常在强衰减通道上进行处理,而没有预补偿,从而导致增强后的明显伪影(见图2)。此外,也有基于物理模型的方法试图逆转水下环境中图像退化过程,通过建立先验条件 [8], [9], [10]。然而,这些方法在复杂的水下环境中通常表现不佳,正如我们早期的研究 [11] 所强调的。

水下图像传播的亮度退化,主要是由于颗粒散射和光吸收,提出了显著挑战 [12], [13], [14], [15]。一种常见的解决方案是应用Retinex理论,这涉及分解光照分量以增强图像亮度,如图1(a)所示。Retinex理论旨在去除或减少入射图像对原始图像的影响,保留物体的反射特性。基于Retinex的图像增强解耦了亮度分量和反射分量,然后调整亮度分量以消除不均匀照明的影响,从而提高图像的视觉效果。然而,传统的基于Retinex的方法忽略了水下特定先验知识在分解过程中的作用。这种忽视导致照明和反射分量之间的高度耦合,导致增强后的图像曝光过度和细节丢失。

在本文中,我们提出了一种新颖的水下图像增强方法来解决颜色偏移亮度损失。我们的方法的关键贡献总结如下:

  • 我们提出了一种新的颜色校正方法,与传统的颜色恒常性方法不同,通过对强衰减通道的像素值进行预补偿来防止颜色伪影。此外,该方法采用了一种创新的直方图均衡化来重新分配像素值,增强图像对比度并减少过度或欠增强区域的差异,从而获得均匀的最终增强图像。

  • 我们采用Retinex理论进行水下成像,通过将水下噪声、纹理和梯度的先验知识集成到带有噪声项的变分模型中。我们设计了针对水下场景的具体惩罚项,成功解耦了照明和反射分量,同时减少了噪声的放大

  • 我们将UIE复杂过程分解为三个子任务,通过块坐标下降 [16]、最小二乘法 [17] 和预条件共轭梯度 (PCG) [18] 方法来解决每个子问题。我们通过高效的像素级处理来解决这些子问题。

本文的组织结构如下:第 II 节回顾了水下图像增强的相关工作。第 III 节详细描述了我们的方法。第 IV 节展示了我们方法的广泛实验验证结果。最后,第 V 节讨论了结论与未来的建议。

相关工作

近年来,许多努力集中在改善退化水下图像的可见性上,现有技术大致分为三类:基于模型的水下图像增强(UIE)方法、无模型水下图像增强方法和基于深度学习的水下图像增强方法。

基于模型的水下图像增强方法:

这些方法通常依赖于基于先验假设建立物理成像模型。关键参数被估计以逆转水下成像的退化过程。例如,文献 [19] 使用偏斜梯度运算符生成准确的透射图,并通过四叉树细分法估计背景光,关注平滑度和颜色变化。Ke 等人 [20] 通过景深和边缘图初步估计透射,并基于波长与散射系数的关系调整通道特定的透射图。为了处理复杂的水下散射,他们引入了具有可变平滑参数的加权最小二乘滤波器进行局部背景光估计。Zhou 等人 [21] 开发了一种色线模型来处理光散射和吸收问题,通过交替迭代算法解决水下环境中的传输问题。此外,另一项研究 [22] 采用通道强度先验(CIP)和自适应暗像素(ADP)来减弱回散现象,精确处理不同水下场景中的不均匀照明问题。尽管这些物理模型方法在增强效果上表现良好,但它们忽略了人的视觉感知,同时需要复杂的参数设置,这可能限制其适应性并影响增强图像的视觉吸引力。

无模型水下图像增强方法:

这些方法通常避免构建显式的物理成像模型,而是专注于图像像素的空间域调整。例如,Fu 等人 [23] 通过变分方法利用Retinex模型来分离照明分量,并通过交替方向优化进一步增强图像。文献 [24] 提出了一个BayesianRetinex算法,该算法在多尺度梯度先验的基础上进行反射率和亮度的修复。文献 [25] 研发了一种在变分框架内利用照明通道稀疏先验的方法。此外,另一种创新的方法 [26] 采用加权小波视觉感知融合(WWPF),通过衰减地图引导的颜色校正和基于小波的视觉感知融合,实现有效的水下图像增强。然而,这些方法仍然面临噪声放大、伪影出现和过度颜色校正等挑战。

基于深度学习的水下图像增强方法:

深度学习在各种视觉任务中取得了显著突破 [27], [28]。在这一领域,通常采用两种主要策略。一种是构建端到端架构或使用深度模型直接估计物理参数,以恢复退化图像。Wu 等人 [29] 提出了一个多尺度融合生成网络,能够矫正颜色失衡并增强图像对比度。此外,另一种创新发展 [30] 是一种反射率引导的水下图像增强网络,通过整合原始编码器和反射率编码器的输入来减弱不同场景对修复任务的影响,从而提升了严重退化图像的处理能力。Jiang 等人 [31] 通过多尺度密集增强模块、深度美学渲染模块和双通道注意模块,旨在通过处理浑浊和色差来改善水下图像的对比度和颜色偏移。然而,基于深度学习的方法通常需要大量的训练数据,通常需要真实的水下图像。训练阶段不仅耗费资源,而且耗时,这可能限制其在实际水下图像增强场景中的适用性。

论文方法

在这里插入图片描述
【概述了所提出的结合变分模型的UIE方法,包括像素分布重映射子方法(PDR)和多优先级亮度补偿子方法(MPLC)。**在PDR中,首先对输入图像的强衰减通道像素进行预补偿以避免引入色彩伪影,然后通过调整通道像素分布曲线来校正图像的色彩偏差,使其更符合人眼的视觉效果。**该算法结合PDR方法的结果图像和多种先验知识构建优化模型,通过快速求解器求解得到强解耦后的亮度分量,调整亮度曲线以补偿图像的亮度损失。最后,融合反射率和调整后的光照分量重建水下图像。】

概述

我们的方法由两个主要模块组成:像素分布重映射(Pixel Distribution Remapping, PDR)模块和多先验亮度补偿(Multi-Prior Luminance Compensation, MPLC)模块。其中,PDR模块旨在校正水下图像的颜色偏移并增强对比度而MPLC模块旨在对抗亮度衰减,从而提升图像的清晰度。图3展示了我们方法的详细工作流程。

像素分布重映射(PDR)模块

水下环境和光照条件是导致水下图像质量失真的重要因素,如图 1(b) 所示。这种现象是由水中不同波长的光衰减速率差异引起的。较长波长(如红光)衰减迅速,而较短波长(如蓝光和绿光)在更大深度下更占主导地位。因此,退化的水下图像通常表现为绿色或蓝色调,显著影响视觉质量。

1、像素预补偿

在这里插入图片描述

2、通道拉伸

在这里插入图片描述
在这里插入图片描述

3、像素分布重映射

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

多先验亮度补偿(MPLC)模块

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/492864.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Python从阿里云物联网平台获取STM32温度数据

在物联网(IoT)应用中,设备数据的采集与监控至关重要。本文将详细介绍如何使用Python从阿里云物联网平台获取STM32设备的温度数据。我们将从已有的Java代码出发,逐步将其转换为Python,并处理在过程中遇到的问题&#xf…

回归预测 | MATLAB实现CNN-BiGRU卷积神经网络结合双向门控循环单元多输入单输出回归预测

回归预测 | MATLAB实现CNN-BiGRU卷积神经网络结合双向门控循环单元多输入单输出回归预测 目录 回归预测 | MATLAB实现CNN-BiGRU卷积神经网络结合双向门控循环单元多输入单输出回归预测预测效果基本介绍程序设计参考资料预测效果 基本介绍 CNN-BiGRU,即卷积神经网络(CNN)与双…

基于Spring Boot的雅苑小区管理系统

一、系统背景与意义 随着信息化技术的快速发展,传统的小区物业管理方式已经难以满足现代居民对于高效、便捷服务的需求。因此,开发一款基于Spring Boot的小区管理系统显得尤为重要。该系统旨在通过信息化手段,实现小区物业管理的智能化、自动…

Redis篇-19--运维篇1-主从复制(主从复制,读写分离,配置实现,实战案例)

1、概述 Redis的主从复制(Master-Slave Replication)是一种数据冗余机制,它允许将一台Redis服务器的数据复制到其他Redis服务器。在主从复制中,有一台主服务器(Master)和一个或多个从服务器(Sl…

【ELK】Filebeat采集Docker容器日志

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 介绍filebeat是如何工作的 使用部署filebeat 介绍 Filebeat 是一个用于转发和集中日志数据的轻量级传送器。 Filebeat 作为agent安装在服务器上,监视指…

C缺陷与陷阱 — 8 编译与链接

目录 1 程序的编译过程 2 动态链接的优缺点 2.1 动态链接的优点 2.2 动态链接的缺点 2.3 只使用动态链接 3 函数库链接的5个特殊秘密 4 警惕Interpositioning 5 产生链接器报告文件 1 程序的编译过程 程序的编译过程是将源代码转换成计算机可以执行的机器代码的过程。…

QT c++ 测控系统 一套报警规则(上)

本文适用于pc based的测控系统的上位机,定义了一套报警规则。 由5个部分组成:自定义4布尔类、在全局文件定义工位错误结构体和结构体变量,其它地方给此变量的当前值成员赋值,报警线程类、数据库保存类、弹框类。 1.自定义4布尔类…

作业Day4: 链表函数封装 ; 思维导图

目录 作业:实现链表剩下的操作: 任意位置删除 按位置修改 按值查找返回地址 反转 销毁 运行结果 思维导图 作业:实现链表剩下的操作: 1>任意位置删除 2>按位置修改 3>按值查找返回地址 4>反转 5>销毁 任意…

WebSocket入门与结合redis

WebSocket是什么 WebSocket 是一种用于在客户端和服务器之间建立双向通信的协议,它能实现实时、持久的连接。与传统的 HTTP 请求响应模式不同,WebSocket 在建立连接后允许客户端和服务器之间相互发送消息,直到连接关闭。由于 WebSocket 具有…

WSL Ubuntu

文章目录 1. 概述1.1 什么是适用于 Linux 的 Windows 子系统1.2 什么是 WSL 21.3 WSL 2 中的新增功能1.4 比较 WSL 2 和 WSL 1 2. 参考资料3. 修改存储位置4. 网络访问 1. 概述 1.1 什么是适用于 Linux 的 Windows 子系统 适用于 Linux 的 Windows 子系统可让开发人员按原样运…

unity接入coze智能体

官网链接 coze智能体创建、设置 点击创建–选着智能体,随便起一个名字,就可以了 添加令牌 把随便起一个名字,设置时间,把所有选项都勾选上,一定要勾选所有团队空间,否则无法点击确定。 点击确定后&a…

基于51单片机的交通灯设计—夜间、紧急、复位、可调时间、四个数码管显示

基于51单片机的交通灯设计 (仿真+程序+原理图+PCB+设计报告) 功能介绍 具体功能: 1、采用四方向数码管设计,更加符合真实的交通信号灯设计; 2、左侧按键从上到下依次为…

省略内容在句子中间

一、使用二分查找法 每次查找时,将查找范围分成两半,并判断目标值位于哪一半,从而逐步缩小查找范围。 循环查找 计算中间位置 mid Math.floor((low high) / 2)。比较目标值 target 和中间位置的元素 arr[mid]: 如果 target ar…

Python:动态粒子爱心

预览 代码结构概述 这段代码使用了 pygame 库来创建一个动态的图形窗口,绘制一个心形图案,并在其中显示闪烁的文本。代码主要分为以下几个部分: 初始化和设置心形曲线的计算粒子类的定义生成粒子文本设置主循环 1. 初始化和设置 import p…

springboot449教学资源共享平台(论文+源码)_kaic

摘 要 如今社会上各行各业,都喜欢用自己行业的专属软件工作,互联网发展到这个时候,人们已经发现离不开了互联网。新技术的产生,往往能解决一些老技术的弊端问题。因为传统教学资源共享平台信息管理难度大,容错率低&am…

DataOps驱动数据集成创新:Apache DolphinScheduler SeaTunnel on Amazon Web Services

引言 在数字化转型的浪潮中,数据已成为企业最宝贵的资产之一。DataOps作为一种文化、流程和实践的集合,旨在提高数据管道的质量和效率,从而加速数据从源头到消费的过程。白鲸开源科技,作为DataOps领域的领先开源原生公司&#xf…

【大模型】GraphRAG技术原理

核心概念 GraphRAG 的核心在于用大模型构建知识图谱知识图谱聚类社区化RAG RAG就是输入(问题知识)到大模型 1-大模型自动从海量数据中构建知识图谱(提取合并实体关系) 2-聚类算法从知识图谱中聚类社区并生成社区摘要 3-输入问题…

揭秘区块链隐私黑科技:零知识证明如何改变未来

文章目录 1. 引言:什么是零知识证明?2. 零知识证明的核心概念与三大属性2.1 完备性(Completeness)2.2 可靠性(Soundness)2.3 零知识性(Zero-Knowledge) 3. 零知识证明的工作原理4. 零…

王佩丰24节Excel学习笔记——第十二讲:match + index

【以 Excel2010 系列学习,用 Office LTSC 专业增强版 2021 实践】 【本章小技巧】 vlookup与match,index 相结合使用match,index 结合,快速取得引用的值扩展功能,使用match/index函数,结合照相机工具获取照片 一、回顾…

探秘C语言:从诞生到广泛应用的编程世界

引言 在编程的广袤天地里,C 语言宛如一颗璀璨的恒星,持久而耀眼地散发着光芒。自诞生以来,它就以独特的魅力和强大的功能,深深扎根于软件开发的各个层面。无论是构建复杂的操作系统,还是操控微小的嵌入式设备&#xff…