Window10 配置NNUnet完成官方任务分割
NNUnet论文介绍
nnUnet是一个针对医学图像分割提出得一个即开即用的框架,用户只需要按照官方给出的数据要求进行格式转换便可以进行快速的医学图像分割的训练和推演。其更新的V2版本代码变得更加易读和方便使用,并且支持2D的图像和一些除nii格式的图像分割任务。具体的可以参考论文原文:论文-nnUnet,代码地址:nnUnetV2-GitHub。
接下来讲解自己在window10上面配置NNunet 并执行官方数据训练的过程,推演后续在写。
安装NNUnet的前期准备:
写在前面:下面讲到的执行安装命令的操作都是在Anaconda Promote中以命令行的方式执行的!!!
下面讲解的主要是官网指导的安装流程:Anaconda+Pytorch安装指引
1、按照官网的安装指导,建议使用Anaconda安装虚拟环境来运行NNunet。
Anaconda安装过程:见官网Anaconda下载地址
安装完成后:执行一下命令安装一个python的虚拟环境:
conda create -n nnUnet python=3.9
2、接下来需要安装最新版本的Pytorch:参照官网Pytorch安装教程参考命令,可以使用conda或者pip 具体的请根据自己的情况在官网选择后复制,我此处选用conda(可以安装GPU所需要的依赖一起)
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia
3、安装Git 方便后面的nnUnet安装。使用conda安装Git
conda install git
安装NNunet
对于NNUnet有两种可用的安装方式:如官网所示:
本人因为是需要对代码进行研究和改进选择的是第二种安装方式:
如果要安装第二种,需要前面的Git成功安装如上面图像所描述,直接执行上面的代码便可以完成安装。此处说一下我的建议或者遇到的问题:
首先在命令窗口查看自己的路径,如果此时是在C盘建议改到其他盘:运行下面命令即可
\(base) C:\Users\Admin>D:
然后依次再执行
git clone https://github.com/MIC-DKFZ/nnUNet.git
cd nnUNet
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple
最后一句注意有点.并且通过切换国内源加快安装速度。
最后在通过pip安装hiddenlayer,这是一个可选项,不安装不影响运行。
开始NNUnet的训练配置之旅。
很多人都是卡在这步无法开始,这部分着重讲操作,不讲原理和原因。
一、数据集转换
数据集的转化成功,nnUnet基本就成功了。很多人都是卡在这个地方。
1、先在你刚刚git clone 的地方,找到nnUnet这个文件夹,然后再该目录下新建三个文件夹:
如下图:
然后再刚刚新建的文件夹下,继续新建三个文件夹,这一步请忽略掉我此处出现的Dataset002_heart(这是我运行预处理后生成的):
2、下载十项医学全能的数据:官网选择task02 这部分数据最小,可以快速的下载并进行后面的操作。这个可以下载下来放在任何一个地方,但请记住它的位置。
3、设置环境变量:这一步十分重要,如果设置错了,下面的数据转换就无法成功执行。
首先windows键+R :运行sysdm.cpl 进入到如下界面:点击高级
点击高级
点击环境变量进行设置:
注意:此处的环境变量要添加在系统变量中:
分别增加三个环境变量:冒号后面对应的值为你刚刚在前面新建的三个文件夹对应的位置。
nnUnet_raw:
nnUnet_results:
nnUnet_preprocessed:
4、当上述配置都成功以后:就可以使用官方的命令对数据进行转换了:
nnUNetv2_convert_MSD_dataset -i 原数据集的路径 -overwrite_id 02
最后这里的02 是我们从官网下载下来的时候,任务时Task2.如果下载的是其他数据集,按照ID号进行更改即可。
运行成功后便可以在我们刚刚创建的nnUnetFrame文件夹中看到我们转换好的数据
补充:如果要使用自己的数据,就可以在运行转换成功后,进入nnNNunet 查看
这里面的数据结构和dataset.json 文件。按照这种格式,自己去写一个转换自己数据集的脚本就可以,官方也提供了一些常用数据集的转换脚本,大家可以进行参考:官网的数据格式提示
数据集转换脚本参考 这里会下次我们搞明白后详解。这个文档主要是实现官方数据的训练。
二、运行数据预处理
在前面数据的问题解决以后,直接运行下面的默认命令就可以按照NNunet的计划进行数据预处理:
-d 后面的数字为任务对应的id 我们这里是2
nnUNetv2_plan_and_preprocess -d 02 --verify_dataset_integrity
如果没有问题则会弹出如下界面,这也是论文中数据指纹data fingerprint 的提取信息
这一步成功后,距最后就只差一步训练了:
三、训练
调用官网的nnUnetv2_train 这个命令,并给出指定的参数就可以开始运行。给出训练2D网络的命令如下:
nnUNetv2_train 002 2d 0
其他命令参考:官网使用说明