学习资源:https://www.youtube.com/watch?v=Z-65nqxUdl4
@努力的小巴掌 记录计算机视觉学习道路上的所思所得。
1、准备图片images
收集数据网站:OPEN IMAGES
2、准备标签labels
网站:CVAT 有点是:支持直接导出yolo格式的标签
步骤:创建项目---Projects---输入类别--上传数据
目标检测标签文件格式:
每一行代表一个检测对象:类别,Center_x, Center_y, W, H
每一个label文件中的行数,对应该张图片中检测对象的数量
注意:Center_x, Center_y, W, H这4个数字是浮点数,因为是相对于整个图像的大小
3、文件格式化
images
labels
名称完全相同,拓展名不同
4、开始训练
yolov8的便捷之处在于,可以直接在python中使用代码运行。或者命令行运行。
方法1:python解释器运行
创建main.py
- 下载库:from ultralytics import YOLO
ultralytics库占用空间挺大的。做好准备。
- 加载模型:model = YOLO("yolov8n.yaml")
这个模型对应着官网的不同版本,n到x,适应的目标检测越来越大。
按照任务不同进行模型的选择。
- 创建配置文件
config.yaml
config.yaml文件的位置与main.py位于同一个目录下。可以正常运行。
path指向存放data路径,train和val是存放图片的具体位置。
注意:config文件中的path需要是绝对路径(直接去文件夹复制就好了),不要是相对路径,不然就会报错。
如上图,设计train和val是同样的图片; 可以用相同的数据作为train和val。
方法2:终端运行
yolo detect train data=config.yaml model='yolov8n.yaml' epochs=2
参考:
CLI - Ultralytics YOLO Docs
5、查看训练结果
看图表:
混淆矩阵:有关如何预测不同类别,会包含所有的类别
F1 confidence curve
Precison confidence curve
Precison recall curve
Loss:确保损失是在下降的
看图片结果判断
6、使用全新图片或者视频进行预测以判断模型好坏
创建predict.py文件
参考:【yolov8语义分割】跑通:下载yolov8+预测图片+预测视频-CSDN博客