SvANet:微小医学目标分割网络,增强早期疾病检测

SvANet:微小医学目标分割网络,增强早期疾病检测

    • 提出背景
      • 前人工作
        • 医学对象分割
        • 微小医学对象分割
        • 注意力机制
    • SvANet 结构图
      • SvANet 解法拆解
        • 解法
        • 逻辑链

 


论文:SvANet: A Scale-variant Attention-based Network for Small Medical Object Segmentation

代码:https://github.com/anthonyweidai/SvANet

提出背景

一种新型神经网络,名为SvANet,该网络专为图像中小型医疗对象的分割而设计,这对于早期疾病检测和准确诊断至关重要。

  1. 问题背景:早期检测和诊断疾病可以显著提高治疗效果。当疾病表现为医学图像中的小感染区域时,这一点尤为重要,因为这些小区域难以准确检测。

  2. 当前挑战:传统的深度学习模型,如卷积神经网络(CNNs),在小对象分割方面常常遇到困难,因为它们通过重复的处理步骤(如卷积和池化)丢失了重要细节。随着模型对图像数据更深层的处理,这个问题会加剧。

  3. SvANet解决方案:提出的SvANet通过以下方式解决这些挑战:

    • 蒙特卡罗注意力:此组件在不同的尺度上生成注意力图,帮助网络了解在图像中应该关注的位置。
    • 尺度变化注意力:这可能允许网络对图像中不同大小的特征给予不同程度的关注,这对检测小对象至关重要。
    • 视觉变压器:结合传统的卷积方法和视觉Transformer,以捕获图像中的局部和更全局的特征。
       
      这种模型以一种类似于Transformer处理序列的方式处理图像,可能更好地捕捉全局上下文。
  4. 性能:SvANet在多种类型的医学图像中分割小医疗对象方面表现出色,通过在几个数据集上的高分表现得到证明,非常接近医生的诊断结果。

    这些数据集包括肾肿瘤、皮肤病变、肝肿瘤、视网膜等图像,其中感兴趣的对象与整个图像大小相比非常小。

SvANet是一种复杂的工具,旨在增强医学成像中微小、可能表明疾病的异常的检测,从而支持更好的早期诊断实践。

前人工作

这段内容主要讨论了医学图像分割中几个关键的研究领域和技术进展,特别是如何处理小尺寸的医疗对象。我来为你简化解释每一部分:

医学对象分割
  • 基础技术: 使用编码器-解码器结构进行医学图像分割。这种结构首先通过编码器提取特征,然后通过解码器生成分割掩码,以区分图像中的不同医学对象。
  • U形结构: 通过使用卷积层连接编码器和解码器的分支,这种结构帮助信息在网络中有效传播,用于更好地分割图像中的对象,如肿瘤细胞等。
微小医学对象分割
  • 挑战: 深度学习中的卷积和池化操作可能会压缩输入数据,损害医学对象的形态特征。
  • 解决方案: 提出多种方法来改善小尺寸对象的分割效果,包括使用空洞卷积、跳跃连接、特征金字塔、多列结构和注意力机制等,这些技术有助于提取和放大图像中的小对象特征。
注意力机制
  • 应用: 在语义分割中广泛使用注意力机制来突出重要特征。
  • 技术创新: 结合通道注意力和空间注意力,提高多维特征的学习能力和分割精度。还引入了反向注意力和自注意力技术,以提取更细致的边界信息和增强输入数据内部的依赖关系。

 

SvANet 结构图

在这里插入图片描述

这张图是一个复杂的神经网络架构图,称为SvANet,用于医学图像的小物体分割。

  1. 输入图像: 最左侧展示了不同医学成像方式的小医疗对象的图片,包括全幅成像(WSI)、眼科成像(Oph)、皮肤科成像(Derm)、结肠镜检查(COL)、磁共振成像(MRI)、计算机断层扫描(CT)、和显微镜成像(MSCP)。

  2. MCAtn(蒙特卡罗注意力)模块: 在左上方的虚线框内,这部分通过使用不同规模的池化输出大小来生成注意力图,从而在单一阶段内学习小物体的空间信息和对象关系。

  3. SvAttn(尺度变化注意力)模块: 在顶部中间的虚线框内,此模块生成基于逐步压缩的特征图的注意力图,从而捕捉小医疗对象的位置和形态本质。

  4. AssemFormer: 在右上角的虚线框中,这部分结合了卷积和视觉变换器,通过组装张量来融合局部空间层次和片间表示,提供图像数据的全面理解。

  5. 卷积与池化操作: 图中展示了多阶段的卷积和池化操作,这些都是深度学习中常用的技术,用于提取特征和降低维度。

  6. ASPP(空洞空间金字塔池化): 在预测步骤之前,这一模块用于捕捉图像中的上下文信息,有助于改善分割的准确性。

  7. 预测输出: 图的右下角展示了不同成像方式的医学图像分割结果。

整体来看,这个架构通过结合传统的卷积神经网络和最新的视觉变换器技术,旨在更有效地检测和分割医学图像中的小型对象,特别是在复杂和信息丰富的医疗图像处理场景中。

 

以视网膜图像分割为例:

  1. 输入图像: 在此例中,输入图像为视网膜成像(Oph),如图中左侧部分所示。视网膜图像通常用于诊断各种眼病,如糖尿病性视网膜病变等。

    视网膜图像的分辨率和细节要求极高,因为需要精确地识别和分割出细微的血管和病变区域。

  2. MCAtn(蒙特卡罗注意力): 这一模块处理视网膜图像,通过不同规模的池化来创建注意力图,这有助于模型在不同大小的结构上聚焦,特别是小而重要的细节,如微小血管或早期病变。

  3. SvAttn(尺度变化注意力): 在处理视网膜图像时,这个模块通过分析不同尺度的特征图来更好地理解图像的深层结构。

    它帮助模型在不同层次上了解视网膜的复杂结构,特别是在图像中较难观察到的部分。

  4. AssemFormer: 这个部分将卷积层和视觉变换器的优势结合起来,通过组装张量,提供对视网膜图像局部和全局特征的深入理解。

    它有效地整合了视网膜图像中的局部细节和整体结构信息,有助于提高分割的准确性和鲁棒性。

  5. 预测输出: 最终,模型预测视网膜图像中的关键特征,如图中右下角的示例。

    这可以包括分割血管、识别病变区域等,这些信息对于后续的诊断和治疗规划至关重要。

通过这种高级别的网络架构,SvANet能够处理复杂的视网膜图像,并执行精确的医学图像分割任务,从而支持眼科医生更好地诊断和治疗眼部疾病。

这样的技术进步对于提早诊断和治疗许多潜在严重的眼部疾病具有重要意义。

SvANet 解法拆解

目的:提高对医学图像中小型医疗对象的分割和识别精度。

问题

  1. 小型医疗对象在图像中的特征不明显,易被忽略。
  2. 多尺度的特征捕捉困难,导致在不同尺寸和深度的特征识别上存在局限性。
  3. 传统的卷积网络在处理极小对象时信息丢失严重。
解法

消融实验:蒙特卡洛注意力 (MCAttn) 和 交叉尺度引导是提高预测精度的关键组件,而AssemFormer和MCBottleneck对提高阳性诊断(有某种疾病存在)的准确性至关重要。

  1. 蒙特卡洛注意力 (MCAttn)
    • 特征:使用随机采样的池化操作生成尺度不依赖的注意力图,允许模型在不同尺度上捕捉关键信息。
    • 原因:传统的全局平均池化在捕获跨尺度相关性方面能力有限。
    • 例子:在处理含有细小血管的视网膜图像时,MCAttn 能够增强模型对这些微小结构的识别能力。

处理特征提取过程中的尺度不变性,强化模型在处理小尺度特征时的表现。

与传统的全局注意力机制相比,MCAttn在特定的池化层中实施,直接增强了小对象特征的识别率,减少了背景噪声的干扰。

在这里插入图片描述

图显示了使用不同注意力机制的MCBottleneck和跨尺度引导(Cross-scale Guidance)生成的输出特征图。

  • (a) 输入图像:原始的医学图像。
  • (b) 地面真实情况(Ground Truth):标注了正确的医学对象位置和形态。
  • ©, (d), (e), (f):不同注意力机制(如SE、CBAM、CoorAttn)下的输出特征图,展示了模型如何处理输入图像并突出不同特征。
  • (g) 单元格代表使用蒙特卡洛注意力机制的输出特征图

通过对比 (b)、(g),这些图表展示了SvANet和其他模型如何在处理细小和微小医学对象方面的不同,特别是在保留细节和精确定位方面的能力。

  1. 跨尺度特征引导
    • 特征:利用早期模型阶段的高分辨率特征来指导后续阶段的特征学习。
    • 原因:小型医疗对象的信息内容随对象尺寸减小而显著减少,需要额外的引导来增强特征的学习。
    • 例子:在处理多层次的皮肤癌图像时,跨尺度特征引导帮助模型在深层学习小癌症区域的同时,不丢失浅层的高分辨率细节。

通过跨不同阶段的特征引导来增强模型对细节的捕捉能力。

利用高分辨率特征来指导模型在后续阶段更好地学习小尺度医疗对象的特征。

  1. 尺度变化注意力 (SvAttn)
    • 特征:处理全局特征表示有局限性,通过跨多个尺度处理全局依赖性。
    • 原因:需要在保持长距离相关性的同时克服单一尺度特征的局限。
    • 例子:在处理MRI图像中的小肿瘤时,SvAttn 允许模型在不同的尺度上有效分辨肿瘤和正常组织。

使模型能在不同尺度上动态调整,从而更精准地识别和分割小尺度医疗对象。

  1. 与视觉变换器结合的卷积 (AssemFormer)

    • 特征:结合了卷积和变换器的优势,同时学习局部和全局特征。
    • 原因:变换器缺乏归纳偏见,需要与卷积结合来增强特征学习。
    • 例子:在处理复杂的脑部图像时,AssemFormer能够同时捕捉到精细的局部结构(如血管和神经纤维)和整体的脑区分布。

     
    结合了卷积和变换器操作,同时学习输入医学图像的局部和全局特征。

    通过融合两种技术的优势,增强模型对医疗对象形态、深度和颜色分布的全局信息捕捉能力。

逻辑链

这些子解法构成一个网络式的逻辑链,其中每个子解法相互支持,共同解决小型医疗对象识别和分割的问题:

  • 蒙特卡洛注意力 提供了跨尺度的特征识别能力。
  • 跨尺度特征引导 利用高分辨率特征强化后续学习。
  • 尺度变化注意力 进一步增强跨尺度特征的全局依赖处理。
  • 与视觉变换器结合的卷积 结合局部与全局特征学习,确保详细和全面的对象分割。

这种方法能够显著提高对医学图像中小型和超小型对象的分割精度,对提早发现和诊断疾病至关重要。

在这里插入图片描述
这张图展示了在不同数据集(ATLAS、KiTS23和SpermHealth)中对各种医学对象(如肿瘤、囊肿和精子)的分割结果。

这些示例反映了不同模型在处理超小对象、小对象和超过10%面积的对象时的效果:

  • (a) 输入图像:原始医学扫描图。
  • (b) 地面真实情况(Ground Truth):用不同颜色标记的医学对象,例如绿色代表肝脏,红色代表肿瘤。
  • © HRNet的预测结果。
  • (d) TransNetR的预测结果。
  • (e) SvANet的预测结果(即本文提出的方法)。

图中显示SvANet在定位和识别医学对象方面通常比其他方法更为准确和详细,特别是在细节和边界的识别上。

视网膜血管分割:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/376232.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中职网络安全B模块渗透测试server2003

通过本地PC中渗透测试平台Kali对服务器场景Windows进⾏系统服务及版本扫描渗透测 试,并将该操作显示结果中Telnet服务对应的端⼝号作为FLAG提交 使用nmap扫描发现目标靶机开放端口232疑似telnet直接进行连接测试成功 Flag:232 通过本地PC中渗透测试平台…

【Lora模型推荐】Stable Diffusion创作具有玉石翡翠质感的图标设计

站长素材AI教程是站长之家旗下AI绘图教程平台 海量AI免费教程,每日更新干货内容 想要深入学习更多AI绘图教程,请访问站长素材AI教程网: AI教程_深度学习入门指南 - 站长素材 (chinaz.com) logo版权归各公司所有!本笔记仅供AIGC…

基于stm32+小程序开发智能家居门禁系统-硬件-软件实现

视频演示: 基于stm32智能家居门禁系统小程序开发项目 视频还有添加删除卡号,添加删除指纹,关闭继电器电源等没有演示。 代码Git: https://github.com/Abear6666/stm32lock 总体功能: 本门禁系统主要解锁功能分别为卡…

android13 设置左右分屏修改为单屏幕,应用分屏改为单屏

总纲 android13 rom 开发总纲说明 目录 1.前言 2.系统设置实现分析 3. 设置修改 4.编译与验证 5.猜测 6.彩蛋 1.前言 android13中,系统设置变成,左边是一级菜单,右侧是二级菜单, 这样跟我们以前android7/8/9的布局是不一样的,我们需要将它修改为一级菜单,点进去…

mysql 5.7.44 32位 zip安装

前言 因为研究别人代码,他使用了5.7的 32位 mysql ,同时最新的 8.4 64位 mysql 不能用官方lib连接。所以安装这个版本使用,期间有些坑,在这里记录一下。 下载路径 mysql官方路径:https://downloads.mysql.com/archi…

Unity如何查找两个transform最近的公共parent

查找两个子对象最近的父对象 一、问题背景二、解决方案思路核心算法代码 三、总结 一、问题背景 最近看到个关于Unity的问题:在Hierarchy面板中的游戏对象,给定两个子物体transform对象,如何查找这两个transform最近的公共父级parent。感觉挺…

从 ArcMap 迁移到 ArcGIS Pro

许多 ArcMap 用户正在因 ArcGIS Pro 所具有的现代 GIS 桌面工作流优势而向其迁移。 ArcGIS Pro 与其余 ArcGIS 平台紧密集成,使您可以更有效地共享和使用内容。 它还将 2D 和 3D 组合到一个应用程序中,使您可以在同一工程中使用多个地图和多个布局。 Arc…

Linux桌面溯源

X窗口系统(X Window System) Linux起源于X窗口系统(X Window System),亦即常说的X11,因其版本止于11之故。 X窗口系统(X Window System,也常称为X11或X)是一种以位图方式显示的软件窗口系统。…

保姆级教你如何在大学期间获得自己的一项个人软著(1)

注册与实名认证 1. 注册与实名认证 已注册和实名认证 or 直接使用组织账号 进行软著申请的,可以跳过这部分 1.1 注册 登录中国版权保护中心 中国版权登记业务平台 点击右上角的用户中心 点击立即注册 选择个人身份进行注册 返回登记页面中国版权登记业务平台…

【教程】Hexo 部署到 Github Page 后,自定义域名失效的问题

目录 前言&问题描述解决方案细节 前言&问题描述 近期给 Github Page 上托管的静态网站映射了自定义域名(aiproducthome.top),之后发现每次更新并部署 hexo 到 Github Page (hexo d)后就会出现自定义域名失效的…

FDL与Kettle功能对比分析之定时任务DDL

开发者在进行数据处理任务时, 一旦源数据库的表结构发生变化,而目标数据库没有及时进行同步,就会导致任务执行失败。DDL同步就是用来解决这一问题,它会自动识别源表结构变化,并及时更新到目标数据库中,保障…

使用 Python OpenCV 创建图像到卡通转换器

https://pyseek.com/2022/07/image-to-cartoon-converter-in-python/ 一、说明 你有没有试过把自己的照片转换成卡通画?顺便说一句,这不是开玩笑。很多人喜欢把他们的照片变成卡通画并在社交媒体上分享。就连我自己也多次尝试过这种技术。有很多在线工具…

全局代理的判断维度与实用分析

在这个数字化时代,全局代理成为了许多用户保护隐私、加速访问的必备工具。然而,面对市场上琳琅满目的代理服务,如何做出明智的选择?作为您的专业测评团队,我们深入探索了全局代理的多个判断维度,并精选了极…

隔离驱动-视频课笔记

目录 1、需要隔离的原因 1.2、四种常用的隔离方案 2、脉冲变压器隔离 2.1、脉冲变压器的工作原理 2.2、泄放电阻对开关电路的影响 2.3、本课小结 3、光耦隔离驱动 3.1、光耦隔离驱动原理 3.2、光耦隔离驱动的电源进行分析 3.3、本课小结 4、自举升压驱动 4.1…

CANoe:为什么两个VLAN接口不能设置同一个网络的IP地址呢?

经常玩CANoe的人应该配置过TCP/IP Stack中网络节点的网卡信息,基本的信息包含:MAC地址、IP地址、子网掩码、默认网关、MTU值、IPv6地址。 如果你想让发送出去的报文携带VLAN tag,可以在网卡上添加VLAN tag信息。 此时你就能得到两个新的网卡V…

MongoDB教程(一):Linux系统安装mongoDB详细教程

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 文章目录 引言一、Ubuntu…

卷积神经网络——LeNet——FashionMNIST

目录 一、文件结构二、model.py三、model_train.py四、model_test.py 一、文件结构 二、model.py import torch from torch import nn from torchsummary import summaryclass LeNet(nn.Module):def __init__(self):super(LeNet,self).__init__()self.c1 nn.Conv2d(in_channe…

一文了解MySQL的表级锁

文章目录 ☃️概述☃️表级锁❄️❄️介绍❄️❄️表锁❄️❄️元数据锁❄️❄️意向锁⛷️⛷️⛷️ 介绍 ☃️概述 锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中,除传统的计算资源(CPU、RAM、I/O)的争用以外&#xff0…

【深度学习基础】MacOS PyCharm连接远程服务器

目录 一、需求描述二、建立与服务器的远程连接1. 新版Pycharm的界面有什么不同?2. 创建远程连接3. 建立本地项目与远程服务器项目之间的路径映射4.设置保存自动上传文件 三、设置解释器总结 写在前面,本人用的是Macbook Pro, M3 MAX处理器&am…

开发个人Ollama-Chat--6 OpenUI

开发个人Ollama-Chat–6 OpenUI Open-webui Open WebUI 是一种可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线运行。它支持各种 LLM 运行器,包括 Ollama 和 OpenAI 兼容的 API。 功能 由于总所周知的原由,OpenAI 的接口需要密钥才…