UNet又升级了!北大最新提出LightM-UNet,用Mamba设计1.8M参数UNet,比nnU-Net小了116倍,计算量减少21倍,精度依然SOTA!
这种将Mamba与UNet结合的策略利用了两者在图像处理和网络架构上的优势,既能保持较低的计算成本,又能轻松实现优异的分割性能,在高效性、准确性、创新性等方面都遥遥领先,是医学图像分割非常有潜力的研究方向。
更赞的是,对于想发论文的同学来说,Mamba是新技术,还没那么卷,相关的Mamba+UNet创新空间自然也大,还有很多优秀的成果给我们作参考,无疑是非常好的选择。
为了帮同学们抓紧机会,我已经挑选好了12篇Mamba结合UNet的高质量论文供大家参考,全部都有代码,想速发论文拿下顶会的别错过啦。
论文原文+开源代码需要的同学看文末
Lightm-unet: Mamba assists in lightweight unet for medical image segmentation
方法:论文介绍了LightM-UNet,这是一种基于Mamba的轻量级网络,它在2D和3D分割任务中实现了最先进的性能,仅包含100万个参数,与最新的基于Transformer的架构相比,参数数量降低了99%以上,并且GFLOPS也显著降低。
创新点:
-
LightM-UNet:基于Mamba的轻量级网络,仅包含1M参数,比最新的基于Transformer的架构参数减少了99%以上,并且计算负载显著较低。在2D和3D分割任务中,LightM-UNet实现了最先进的性能。
-
Mamba作为轻量级策略:该研究首次尝试将Mamba作为轻量级策略应用于UNet,以增强UNet对全局信息的理解能力。
Semi-mamba-unet: Pixel-level contrastive cross-supervised visual mamba-based unet for semi-supervised medical image segmentation
方法:论文提出了一种结合Mamba架构和U-Net的半监督学习框架,名为Semi-Mamba-UNet。这个模型旨在提高医学图像分割的效率和准确性,尤其是在标注数据有限的情况下。
创新点:
-
对医学图像分割中的Mamba架构进行了探索,这是首次使用有限标注探索Mamba架构。该架构通过使用U型编码器解码器网络中的Visual Mamba作为网络块,提高了医学图像分割的性能。
-
引入了像素级对比学习策略,结合半监督学习,使用有标签和无标签数据最大限度地提高了特征学习能力。通过引入交叉监督学习,通过伪标签的方式增强了网络训练中无标签数据的可用性。
MSVM-UNet: Multi-Scale Vision Mamba UNet for Medical Image Segmentation
方法:论文提出了一个用于医学图像分割的多尺度视觉状态空间模型(MSVM-UNet)。多尺度视觉Mamba UNet通过多尺度深度卷积的设计,不仅可以捕捉各种尺度的信息并模拟所有方向上的长程依赖性,还可以保持计算效率和可接受的参数数量。
创新点:
-
通过在VSS块中引入多尺度卷积,可以更有效地捕捉和聚合来自VMamba编码器的分层特征表示,并更好地处理2D视觉数据。
-
通过同时集成空间和通道信息,LKPE层实现了更高效的特征图上采样。使用我们提出的模块替换解码器中的原始模块后,显著改善了性能,只增加了最小的计算开销和参数数量。
HMT-UNet: A hybird Mamba-Transformer Vision UNet for Medical Image Segmentation
方法:论文提出了一个利用Mamba和Transformer的混合机制,构建了一个U型网络架构模型,用于医学图像分割任务。该模型通过精心设计,增强了其对视觉特征的高效建模能力,特别是在捕获长距离空间依赖方面表现出色。
创新点:
-
提出了一种新型的混合模型HMT-UNet,该模型结合了状态空间模型中的Mamba和Transformer的架构。
-
设计了MambaVision块和Mixer,这些块结合了MambaVision和Transformer的自注意力机制,通过在Mamba架构后端整合自注意力机制,显著提升了模型的建模能力。
-
引入了MSAA模块来进一步优化CNN编码器的输出特征,通过合并不同尺度的特征来增强解码器的能力。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“曼巴分割”获取全部论文+开源代码
码字不易,欢迎大家点赞评论收藏