医学图像分割之TransUNet

       

目录

一、背景

二、提出问题

三、解决问题

四、网络结构详解

CNN部分(ResNet50的前三层)

transformer部分

U-Net的decoder部分

五、模型性能


        开头处先说明下TransUNet的地位:它是第一个将transformer用于U型结构的网络。

一、背景

        医学图像分割是发展卫生保健系统的先决条件,尤其对疾病诊断和质量方案。在各种医学图像分割模型中,U型结构,也就是U-Net非常流行。

二、提出问题

  1. 由于卷积运算的内在局限性,或者说是卷积运算中,感受野小的原因,导致U-Net在建模过程中,远程依赖方面受限。
  2. transformer是全局自注意机制的可替代结构。但由于transformer的低级细节不足,导致其定位能力受限。

三、解决问题

        在解决U型结构感受野小、远程依赖受限的问题上,很多作者给出的解决办法是使用自注意力机制。由于Transformer中自带自注意力机制,作者是第一个将transformer和U-Net相结合的人。

  1. 由于U-Net结构在医学图像分割中非常流行,可以说是默认的医学图像分割的backbone了,所以作者选择在U-Net结构上进行改编。
  2. 由于transformer的输入为1D的序列,所以在其训练的所有阶段只关注了建模的上下文信息,导致缺少含有细节定位信息的高分辨率特征。所以作者选择将transformer与U-Net结构相结合,将transformer作为U型结构的encoder部分。
  3. transformer作为encoder部分,对transformer后的编码特征是\frac{HW}{P^{2}}*D,为了恢复空间信息,将\frac{HW}{P^{2}}*D恢复至\frac{H}{P}*\frac{W}{P}*D,然后使用U-Net的decoder部分,上采样恢复分辨率至 H*W。虽然也能产生合理的结果,但结果比较粗糙,缺少高分辨率的细节信息。也就是说此时的结构不是transformer的最佳应用,因为通常\frac{H}{P}*\frac{W}{P }比H*W小很多,分辨率在恢复至H*W过程中,不可避免导致定位信息的损失。为了弥补这种定位细节信息的损失,作者继续提出了CNN-Transformer的混合结构。
  4. CNN-Transformer作为U型结构的encoder部分。因为CNN能提取到低级定位细节信息,正好弥补Transformer缺少低级定位信息的不足。在此部分,作者选择使用resnet50的前3阶段作为CNN部分。将resnet50第三阶段得到的特征图作为transformer的patch来源。从而使得transUNet的U型结构得到闭环。

图1 TransUNet结构简图

四、网络结构详解

         从图中也可以看出,TransUNet的网络结构可以分为三部分学习,分别是CNN部分(resnet50的前三层)、transformer部分、U-Net的decoder部分。

CNN部分(ResNet50的前三层)

        CNN部分作者选用了ResNet50的前三层,至于为什么CNN选用的ResNet50,作者并没有给出原因。我的理解是:U-Net的decoder部分除去encoder5外,还有4层,从上往下计数,decoder4和transformer的结果进行skip-connection,上面还剩3层decoder,所以此处采用的ResNet50的前三层,方便后续的跳跃连接 。

        TranUNet中的该部分代码中,要将这三层的每层结果进行保存,每层的结果还要用于skip-connection,除此之外,第三层的特征图还要产生一系列的patches,作为transformer的输入内容。ResNet50的前三层结构如下图所示:

 

 图3 ResNet50网络结构

transformer部分

        此处的transformer部分采用了12层,也就是将transformer运算重复了12次。首先将CNN部分的第三层获得的特征图进行P=16处理,获得16*16=256个patches。将一系列patches输入到transformer模块中,获得 (n_patch, D)= \frac{HW}{P^{2}}*D维度的结果,为了恢复特征图的空间结构,reshape至\frac{H}{P}*\frac{W}{P}*D,然后进行上采样操作。

        关于transformer的具体实现,我想仔细学一些Vis Transformer,然后出一篇博客,详细讲解。 

U-Net的decoder部分

        此部分和U-Net的decoder部分完全一样,后面专门出一篇U-Net文章。

五、模型性能

        在我的数据集CT图像上进行训练,发现TransUNet的性能并没有很好,是不如UNet的。TransUNet的dice是0.8171,而UNet的dice是0.9488。TransUNet的泛化能力不是很好。

        以上是本人对TransUNet的理解,欢迎大家一起交流学习。

参考:经典网络ResNet介绍_fengbingchun的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41936.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于VGGNet乳腺超声图像数据集分析

本人的第一次发文,还在努力学习中,可能有不正确的地方,请各位大神轻喷。 数据集介绍: 乳腺癌是全世界妇女中最常见的死亡原因之一。早期检测有助于减少早期死亡的数量。该数据回顾了使用超声扫描的乳腺癌医疗图像。乳房超声数据集…

Python写一个自动发送直播弹幕的工具,非常好用

昨晚回家,表弟在看LOL直播,看得我气不打一处来,差点就想锤他。 身为程序员的表弟,看直播发弹幕居然还在手动发,当时我就用Python写了一个自动发送弹幕的脚本送给他用。 好了话不多说,我们直接开搞&#xf…

今日作业博客

今天做了一道题目感觉挺不错的,题目是去除重复整数并重新排序。 开始我的想法是先创建一个数组代表一段序列,然后写两个函数,一个去重,一个进行冒泡排序,结果发现实在是过于复杂,所以万般无奈之下只好瞄了一…

通过分析周榜前100名专家的博客文章 手把手教你写出爆款文章

引言 或许你也在用博客来记录自己的学习历程,与别人分享技术。可是有时候你会感觉为什么我的文章也是用心烹饪的,感觉自己文章跟大佬的文章相比质量并不差啊,可是从访问量、点赞数、收藏数、评论数、粉丝数等多个纬度来看都跟大佬差别那么大…

成为顶级博主的秘诀是什么?《乘风者周刊》专访“处女座程序猿”牛亚运

「渡己是一种能力,渡人是一种格局。」 这是“处女座程序猿”牛亚运为自己立下的座右铭。 如今的牛亚运,在国内外十多个平台累计粉丝近100万,全网博客文章浏览量早已超过3000多万,囊括了阿里云乘风者计划专家博主等多个平台顶级博…

2021年度总结 -- 万粉博主的写作荣誉分享,写博客是一种心灵的修行

一、CSDN 的写作经历与荣誉 仅以此文作为 2021 年终总结,顺便跟大家分享一些我的心得经验,希望你我和 CSDN 都越来越好。翻开 2021 CSDN 年度回忆录,有种难以言喻的感觉,有过兴奋、有过开心、有过遗憾,更多的是有过收…

软件测试来喽~这看这博主写的多是一件美事呀

目录 开篇 软件测试模型 V模型 W 模型 X模型 H模型 测试方法 白盒测试 黑盒测试 灰盒测试 黑盒测试方法种类 等价类划分 等价类测试的分类 边界值方法 边界值分析测试方法 决策表方法 决策表的测试方法 开篇 哈喽!大家好,这篇我们来看看…

努力打卡 每天学习 不浪费每一天 Day76

白天学数据结构刷题 晚上学Javaweb 备考蓝桥杯 <1> Scanner 可能会超时 改用StreamTokenizer StreamTokenizer scannew StreamTokenizer(new BufferedReader(new InputStreamReader(System.in))); Window <script>//弹窗/*window.alert("123");alert(…

知识星球喊你来交作业了

各位小伙伴,晚上好,忙碌的一周,不知不觉又周末了,提前祝大家周末愉快! 入驻知识星球已经快两周的时间,已有63位朋友加入进来 有些朋友看了看星球,哇,付费的,然后就望而却步,但我们从来不是为了收费而收费的,因为之前的一系列微信群举措并没有多大效果,不希望微信群…

应老师要求发布作业博客

冒泡排序—— 原理&#xff1a;通过外层for循环 i 遍历一遍数组&#xff0c;内层循环 j 实现比较次数&#xff0c;if 判断来使数与后面的数进行比较和交换位置&#xff0c;比较次数逐渐减少&#xff0c;用数组长度来减去外层循环 i 实现比较次数减少的作用&#xff0c;最后输出…

卡塔尔世界杯终局之战,阿根廷VS法国,是老将加冕还是新王登基?

【世界杯】阿根廷VS法国 不知不觉&#xff0c;世界杯已经走到最后的尾声&#xff0c;此前经历的28天&#xff0c;63场比赛皆是铺垫&#xff0c;卢赛尔体育场将会迎来2022卡塔尔世界杯最终的决赛&#xff0c;究竟是梅西球王加冕还是法国卫冕世界杯冠军&#xff0c;今晚23&#x…

Apple Developer:Verify your identity and review the updated license agreement.

第一步&#xff1a; 确保你的iOS系统是最新的、或者iPad OS系统是最新的&#xff0c;打开iOS、iPad OS 的App Store&#xff0c;搜索Apple Developer&#xff0c;下载最新版本&#xff0c;或者更新为最新版本&#xff01; 第二步&#xff1a; 打开Apple Developer&#xff0…

【小程序云开发】不用后端也能构建完整的微信小程序

文章目录 人工智能福利文章什么是微信小程序云函数云数据库HTTP 云函数定时触发云函数总结写在最后 ✍创作者&#xff1a;全栈弄潮儿 &#x1f3e1; 个人主页&#xff1a; 全栈弄潮儿的个人主页 &#x1f3d9;️ 个人社区&#xff0c;欢迎你的加入&#xff1a;全栈弄潮儿的个人…

Input搜索框与搜索图标对齐解决方法

出现的情况 有些网站需要在搜索框旁写一个紧挨着的放大镜图标框。这时候可能就牵涉到对齐问题。 例如小米商城搜索框&#xff1a; 可以简单写一下这两个框&#xff1a; <div class"header-search"><input class"first" type"text" pl…

全力备战,迎接客户联络深度智能化的“质变时刻”

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 自2022年6月30日在香港联交所主板上市以来&#xff0c;天润融通不断加大在AI方面的研发投入&#xff0c;并确立了以“AI原生”思维重构客户联络系统和流程的产品发展目标。过去的一年中&#xff0c;天润融通推出了多项创新的…

重磅发布!百分点科技正式发布数据科学基础平台DeepMatrix

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 3月30日&#xff0c;由百分点科技主办的“2023数据科学峰会”在北京金隅智造工场科技秀场成功召开。此次大会以“数据进阶”为主题&#xff0c;邀请权威专家学者以科学视角和全球视野解读数据科学、数字政府建设及数字化业务…

2022全球社交电商趋势策略报告

导读&#xff1a; 《报告》显示,后疫情时代,口碑营销和熟人种草已成为社交购物的主要趋势;消费者对购物体验要求提升,AR(增强现实)技术将颠覆传统购物体验。店匠科技与 Snapchat 将基于此趋势,围绕独立站 SaaS、社交电商营销一站式解决方案,助力品牌企业探索建立合适的社交电商…

AI首次挑战DevOps全流程 - AI加持的黑马冠军团队有多厉害?丨IDCF

一. 报名初衷 IDCF 黑客马拉松活动第40场活动&#xff0c;加入了AI元素以后&#xff0c;各个环节明显提效&#xff0c;输出质量更高。IDCF的AI黑马挑战赛&#xff0c;一个汇集了众多DevOps爱好者、开发者的平台&#xff0c;希望能在这个沙龙中探求前沿技术、广交志同道合的朋友…