【实例分割】用自己数据集复现经典论文YOLACT

YOLACT：You Only Look At CoefficienTs

🏆论文下载：paper

🏆代码下载：code

🏆论文详解：YOLACT

🍂🍂1.安装环境

🍂🍂2.数据准备

🌷🌷2.1数据下载

🌷🌷2.2数据格式解析

🍂🍂3.yolact++网络

🍂🍂4.训练yolact

🌷🌷4.1预训练模型

🌷🌷4.2训练网络代码

🌷🌷4.3Pascal SBD数据集

🍂🍂5.测试yolact

🌷🌷5.1测试单张图像并可视化结果

🌷🌷5.2测试单张图像并保存结果影像文件

🌷🌷5.3批量测试文件夹内影像并将结果把保存至指定文件夹

🌷🌷5.4测试COCO数据集

🌷🌷5.5测试COCO数据集并将测试结果写入bbox_detection.json中

🌷🌷5.6COCO验证

🌷🌷5.7计算COCO验证集精度

整理不易，欢迎一键三连！！！

送你们一条美丽的--分割线--

🍂🍂1.安装环境

新建安装环境命令：

conda env create -f environment.yml

版本要求：

python3
pytorch 1.0.1 及以上版本

安装cython、opencv、pillow等包命令：

# Cython needs to be installed before pycocotools
pip install cython
pip install opencv-python pillow pycocotools matplotlib

🍂🍂2.数据准备

🌷🌷2.1数据下载

下载COCO2014/2017数据集，里面有label格式，可以按照这个数据格式准备自己的数据集。这里是废了很大力气的。下载数据集命令：

sh data/scripts/COCO_test.sh

下载数据界面，过程可能比较慢。。。

🌷🌷2.2数据格式解析

        标注文件：instances_train2017.json
        以 COCO2017\annotations_train2017\annotations\instances_train2017.json
为例。这个json文件中的信息有以下5个键值所指。
        基本结构如下：

数据集标注json文件所在目录annotations_train2017，详细文件制作过程请参考【COCO】制作自己的coco格式实例分割数据集

可以在 data/config.py 文件中的dataset_base添加自己的数据集，比如：

my_custom_dataset = dataset_base.copy({'name': 'My Dataset','train_images': 'path_to_training_images','train_info':   'path_to_training_annotation','valid_images': 'path_to_validation_images','valid_info':   'path_to_validation_annotation','has_gt': True,'class_names': ('my_class_id_1', 'my_class_id_2', 'my_class_id_3', ...)
})

🍂🍂3.yolact++网络

使用yolact++网络，需要安装DCNv2网络

cd external/DCNv2
python setup.py build develop

🍂🍂4.训练yolact

默认在coco数据集上训练，所以需要保证第2步制作的数据集是完整的coco格式，否则无法训练。

🌷🌷4.1预训练模型

预训练模型应该放在 ./weights目录下
- 下载 resnet101_reducedfc.pth—— here.
- 下载 resnet50-19c8e357.pth —— here.
- 下载darknet53.pth —— here.
训练命令
- 训练过程中使用ctrl+c终止训练，此时会保存一个 *_interrupt.pth 文件在当前目录.
- 所有训练模型均存放在 ./weights 目录下，文件名命名方式为：<config>_<epoch>_<iter>.pth.

🌷🌷4.2训练网络代码

可以通过修改config文件来修改训练参数。

# Trains using the base config with a batch size of 8 (the default).
python train.py --config=yolact_base_config# Trains yolact_base_config with a batch_size of 5. For the 550px models, 1 batch takes up around 1.5 gigs of VRAM, so specify accordingly.
python train.py --config=yolact_base_config --batch_size=5# Resume training yolact_base with a specific weight file and start from the iteration specified in the weight file's name.
python train.py --config=yolact_base_config --resume=weights/yolact_base_10_32100.pth --start_iter=-1# Use the help option to see a description of all available command line arguments
python train.py --help

多卡训练需要再以上代码前面加上一句export CUDA_VISIBLE_DEVICES=[gpus]命令来实现多卡训练。

如果要用自己的数据集进行训练，需要修改yolact_base_config文件中的‘dataset’内容为‘my_custom_dataset’