MMUNet:形态学特征增强网络在结肠癌病理图像分割中的应用

MMUNet: Morphological feature enhancement network for colon cancer segmentation in pathological images.

发表在:Biomedical Signal Processing and Control2024--影响因子:3.137

南华大学的论文

论文地址:main.pdf (sciencedirectassets.com)

代码地址:https://github.com/Yuanhaojun513/MMUNet

目录

一、摘要

二、介绍

三、方法框架

3.1改变卷积块MCNB和MCNEAB

3.2侵蚀膨胀模块EDM

 3.3边缘特征模块EFM

3.4损失函数

四、实验和结果

4.1实验

4.2结果

五、结论


一、摘要

结肠图像分析是诊断结肠癌的重要步骤,由于病理切片中细胞形状和边界的多样性,故存在困难。在本文中,我们提出了一种u型结肠癌分割网络,将深度可分卷积和形态学方法相结合,减少了模型参数的数量,有效提高了分割精度。我们利用序列卷积和外部焦点作为模型的底层架构,提高了全局和局部特征的能力。我们设计了跳跃连接,以形态学的方式融合编码器的特征,以增强形态学特征。引入边缘增强模块,利用形态学方法提取轮廓信息增强边缘特征。

二、介绍

结肠癌已被证明可以通过细胞的形状、密度和位置来预测临床结果。传统的结肠癌图像分割方法,有些方法取得了一定的成功。然而,它们需要在面对不规则形状时更具竞争力,只适用于某些类型的图像,并且不是很健壮

通过构建融合低级语义和高级语义的编码器-解码器结构,然而,这项工作没有考虑形态学信息的影响,形态学信息对于不规则的病理切片非常重要。连续的下采样和上采样可以获得丰富的语义信息,但会丢失一些目标信息,影响边缘的纹理特征。此外,卷积的局限性导致该网络只关注局部特征而忽略了远程依赖。全局特征和局部特征相辅相成,有利于增强模型提取特征的能力。因此,许多研究者将transformer引入到视觉任务中,以减轻卷积的局域性,增加远程依赖性,但这带来了巨大的计算压力。研究者发现,外部注意(EA)可以以较低的复杂性获得远程依赖的能力。 

因此本文提出了一种形态学方法UNet(MMUNet)来解决病理图像中结肠癌分割中形状不规则和边缘不准确的问题。改进了ConvNeXt的基本模块,使其适合于结肠癌的分割。

我们使用改进的块构造一个多尺度卷积模块(MCNB)来提取多尺度特征。我们构建了一个多尺度卷积外部注意块(MCNEAB),使用MCNB和EA相结合来提取局部和全局特征。其次,利用侵蚀膨胀模块(EDM)对编码器特征进行形态学融合,增强形态学特征;最后,利用边缘特征模块(Edge Feature Module, EFM)提取编码器基特征和解码器基特征,增强边缘特征 。

主要贡献:

1. 构建侵蚀膨胀模块(EDM)和边缘特征模块(EFM),分别引入形态学方法融合编码器特征和提取轮廓,进一步增强形态学特征和边缘特征

2. 我们提出了多尺度卷积块(MCNB)和多尺度卷积外部注意块(MCNEAB),增强了提取全局和局部特征的能力

3. 我们在三个结肠癌数据集上进行了广泛的实验来验证我们方法的有效性。

三、方法框架

它是一个结合卷积神经网络和形态学方法的u形网络,包括由多尺度卷积块和外部注意(EA)组成的基本架构,边缘特征模块(EFM)和使用侵蚀和膨胀的编码器特征融合模块(EDM)。我们仅在前三层使用多尺度卷积块(MCNB),在后两层使用多尺度卷积外部注意块(MCNEAB),从而降低了复杂性并提高了捕获上下文信息的能力。对于EFM,我们使用编码器的前两层和解码器的最后一层的特征信息提取边缘特征。对于EDM,形态学方法将在编码器特征上进行操作,以增强形态学特征。

3.1改变卷积块MCNB和MCNEAB

基于改进的ConvNeXt块,将7 × 7深度卷积分成4个部分。第一部分执行卷积核大小为3,第二部分执行卷积核大小为5,第三部分执行卷积核大小为7。最后一部分保存原始信息,第二部分接收第一次卷积后的结果,第三部分接收第二部分进行卷积后的结果。MCNB用于提取多尺度特征。然后,将MCNB与EA连接起来,得到远程依赖关系,称为多尺度卷积外部注意块。

 EA论文地址:https://arxiv.org/pdf/2105.02358

     ConvNeXt论文地址:https://arxiv.org/abs/2201.0354

EA使用一个外部矩阵M来建模第i个像素和第j行之间的相似性,且M是可学习的、大小可变的,同时,M还可以随着训练过程的进行建模整个数据集不同样本间的联系 在实际应用中,M分为两个:M_k、M_v,分别对应SA中的K和V:A  = Norm(FM_K^T);Fout = AM_v

3.2侵蚀膨胀模块EDM

侵蚀使图像更平滑,并去除小噪声点。膨胀增强了图像的细节,填补了小洞。我们通过侵蚀和膨胀过程融合编码器特征。该方法的优点是去除了噪声并保留了足够的形态学信息。

利用SoftMax对编码器特征映射X进行二值化。使用MaxPooling(内核大小为7,步长为1,填充为3)实现侵蚀和扩展,因为更大的内核捕获更多的上下文信息并扩展接受域。

对编码器特征X1进行并行腐蚀和扩展,对扩展后的特征映射进行Tanh计算加权。一方面,对腐蚀特征图进行Sigmoid加权,并与膨胀特征图相乘计算相似矩阵; 另一方面,利用Sigmoid算法将腐蚀后的特征图与原始地图融合,计算权值,得到原始地图的相似度矩阵。最后对两个相似矩阵信息进行融合。

 3.3边缘特征模块EFM

错误的边界会产生许多错误的病变区域。标准的卷积神经网络提取附加特征来补充边缘特征,但单个特征会丢失边缘信息。由于底层特征具有足够的边缘信息,我们使用编码器的下两层特征和解码器的最后一层特征。EFM对两个输入分别提取轮廓,去除图像中的噪声和不规则部分,得到更准确的边缘信息。

编码器第一层的特征X1直接通过形态学方法计算边缘,得到X1_edge。X2使用第二层编码器特征,通过上采样DwConv和形态学方法提取边缘信息。X1_edge和X2_edge沿通道方向连接,两部分信息融合得到更精确的边缘。最后对编码器特征X和边缘特征求和:

3.4损失函数

由于病理图像的复杂性和多样性,我们选择Dice系数和交叉熵损失来训练我们的网络,它可以关注分割区域的匹配程度和每个像素点的分类精度来提高分割性能。

其中Y_i代表真实值,P_i代表预测值

四、实验和结果

4.1实验

 数据集:三个结肠癌数据进行了广泛的实验,如下数据内容信息。

评价指标:五个评估指标包括Jaccard, Dice系数,Precision, Sensitivity和Specificity。

其中TP (TN)描绘了正确预测的标记为正(负)的病变像素。相反,FP (FN)描述了被标记为正(负)的错误预测的病变像素。

tip 我们的网络使用PyTorch实现,并在具有48G显存的A6000显卡上进行训练。我们选择AdamW作为优化器,学习率设置为0.0015,批大小设置为4,训练epoch设置为400。 我们的数据增强方法包括随机调整大小、随机裁剪、水平翻转和垂直翻转。由于三个数据集具有不同的图像分辨率大小,我们将图像随机裁剪为224 × 224像素。

4.2结果

三种数据集与其他模型进行比较

 消融实验

对比实验

损失函数以及卷积大小选择

五、结论

结肠病理图像是病理学家诊断癌症的重要标准之一,计算机辅助医学诊断对于结肠癌的初步筛查至关重要。本文提出了一种基于MMUNet的结肠癌病理切片病变区域自动分割方法。我们提出的模型在三个结肠癌数据集上得到了验证。首先,我们利用先进的卷积结构来增强模型的特征提取能力,并利用卷积模块与外部关注进行串行化,以获取远程依赖关系,降低模型复杂度。其次,引入形态学方法,重新设计跳跃连接以校正来自编码器的特征,增加形态学信息的重要性。最后,使用形态学方法直接计算边缘,方便模型学习边界特征。实验结果表明,本文提出的方法优于其他竞争方法。在未来的工作中,我们将探索如何设计和使用更多的形态学方法来获得更好的结果,适用于更多的分割任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/340901.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

地理信息科学中的大数据挑战

在信息化爆炸的时代,地理信息科学(GIScience)正经历着前所未有的变革,其中,地理空间大数据的涌现为科学研究与应用带来了前所未有的机遇与挑战。作为地理信息与遥感领域的探索者,本文旨在深入剖析地理空间大…

找不到steam_api64.dll,无法继续执行的原因及解决方法

电脑已经成为我们生活中不可或缺的一部分。然而,在使用电脑的过程中,我们经常会遇到一些常见的问题,其中之一就是找不到某个特定的动态链接库文件,比如steamapi64.dll。这个问题可能会导致某些应用程序无法正常运行,给…

音视频开发—音频相关概念:数模转换、PCM数据与WAV文件详解

文章目录 前言1.模拟数字转换(ADC)1.1ADC的关键步骤: 2.数字模拟转换(DAC)2.1DAC 的基本流程包括: 3.PCM数据3.1PCM 数据的关键要素包括: 4.WAV文件4.1 WAV的构成4.2WAV文件的标准块结构4.3WAV的…

kettle从入门到精通 第六十五课 ETL之kettle 执行动态SQL语句,轻松实现全量增量数据同步

本次课程的逻辑是同步t1表数据到t2表,t1和t2表的表机构相同,都有id,name,createtime三个字段。 CREATE TABLE t1 (id bigint NOT NULL AUTO_INCREMENT,name varchar(10) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci DEFAULT NULL,cr…

View->Bitmap缩放到自定义ViewGroup的任意区域(Matrix方式绘制Bitmap)

Bitmap缩放和平移 加载一张Bitmap可能为宽高相同的正方形,也可能为宽高不同的矩形缩放方向可以为中心缩放,左上角缩放,右上角缩放,左下角缩放,右下角缩放Bitmap中心缩放,包含了缩放和平移两个操作&#xf…

数据整理操作及众所周知【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

Opencv 色彩空间

一 核心知识 色彩空间变换; 像素访问; 矩阵的、-、*、、; 基本图形的绘制 二 颜色空间 RGB:人眼的色彩空间; OpenCV默认使用BGR; HSV/HSB/HSL; YUV(视频); 1 RGB 2 BGR 图像的多种属性 1 访问图像(Ma…

Pytorch 笔记

执行下面这段代码后,为什么返回的是 2 ? vector torch.tensor([7, 7]) vector.shape为什么返回的是 torch.Size([2])? 当你创建一个PyTorch张量时,它会记住张量中元素的数量和每个维度的大小。在你的代码中,torch.t…

Redis 线程模型

Redis 线程模型 背景简介Redis 单线程客户端发起 Redis 请求命令的工作原理单线程面临的挑战及问题 Redis 多线程Redis v4.0 多线程命令Redis v6.0 多线程网络模型 总结 背景 随着年龄的增长,很多曾经烂熟于心的技术原理已被岁月摩擦得愈发模糊起来,技术…

LangChain学习之 Question And Answer的操作

1. 学习背景 在LangChain for LLM应用程序开发中课程中,学习了LangChain框架扩展应用程序开发中语言模型的用例和功能的基本技能,遂做整理为后面的应用做准备。视频地址:基于LangChain的大语言模型应用开发构建和评估。 2. Q&A的作用 …

了解VS安全编译选项GS

缓冲区溢出攻击的基本原理就是溢出时覆盖了函数返回地址,之后就会去执行攻击者自己的函数; 针对缓冲区溢出时覆盖函数返回地址这一特征,微软在编译程序时使用了安全编译选项-GS; 目前版本的Visual Studio中默认启用了这个编译选项…

Java-----String类

1.String类的重要性 经过了C语言的学习,我们认识了字符串,但在C语言中,我们表示字符串进行操作的话需要通过字符指针或者字符数组,可以使用标准库中提供的一系列方法对字符串的内容进行操作,但这种表达和操作数据的方…

Go语言交叉编译

Golang 支持交叉编译, 在一个平台上生成然后再另外一个平台去执行。 以下面代码为例 build ├── main.go ├── go.mod main.go内容 package mainimport "fmt"func main() {fmt.Println("hello world") }windows系统上操作 1.cmd窗口编译…

【OCPP】ocpp1.6协议第4.2章节BootNotification的介绍及翻译

目录 4.2、BootNotification-概述 Boot Notification 消息 BootNotification 请求消息 BootNotification 响应消息 使用场景 触发 BootNotification 的条件 实现示例 构建请求消息 发送请求并处理响应 小结 4.2、BootNotification-原文译文 4.2.1、被中央系统接受之…

ios v品会 api-sign算法

vip品会 api-sign算法还原 ios入门案例 视频系列 IOS逆向合集-前言哔哩哔哩bilibili 一、ios难度与安卓对比 这里直接复制 杨如画大佬的文章的内容: ios难度与安卓对比 很多人说ios逆向比安卓简单,有以下几个原因 1 首先就是闭源,安卓开源…

无人售货机零售业务成功指南:从市场分析到创新策略

在科技驱动的零售新时代,无人售货机作为一种便捷购物解决方案,正逐步兴起,它不仅优化了消费者体验,还显著降低了人力成本,提升了运营效能。开展这项业务前,深入的市场剖析不可或缺,需聚焦消费者…

ch4网络层---计算机网络期末复习(持续更新中)

网络层概述 将分组从发送方主机传送到接收方主机 发送方将运输层数据段封装成分组 接收方将分组解封装后将数据段递交给运输层网络层协议存在于每台主机和路由器上 路由器检查所有经过它的IP分组的分组头 注意路由器只有3层(网络层、链路层、物理层) 网络层提供的服务 一…

discuz如何添加主导航

大家好,今天教大家怎么样给discuz添加主导航。方法其实很简单,大家跟着我操作既可。一个网站的导航栏是非常重要的,一般用户进入网站的第一印象就是看网站的导航栏。如果大家想看效果的话可以搜索下网创有方,或者直接点击查看效果…

SpringCloud Feign用法

1.在目标应用的启动类上添加开启远程fein调用注解: 2.添加一个feign调用的interface FeignClient("gulimall-coupon") public interface CouponFeignService {PostMapping("/coupon/spubounds/save")R save(RequestBody SpuBondTo spuBounds);…

C++语言学习(七)—— 继承、派生与多态(一)

目录 一、派生类的概念 1.1 定义派生类的语法格式 1.1.1 定义单继承派生类 1.1.2 定义多继承派生类 1.2 继承方式 二、公有继承 三、派生类的构造和析构 四、保护成员的引入 五、改造基类的成员函数 六、派生类与基类同名成员的访问方式 七、私有继承和保护继承 7.…