详解YOLOv8网络结构/环境搭建/数据集获取/训练/推理/验证/导出/部署
深入解析YOLOv8:网络结构与推理过程
YOLO? You Know! --YOLOV8详解
一:yolov8总体结构
1.Backbone:它采用了一系列卷积和 反卷积层只来提取特征,同时也使用了残差连接和瓶颈结构来减小网络的大小和提高性能。该部分采用了C2f模块作为基本构成单元,与YOLOv5的C3模块相比,C2f模块具有更少的参数量和更优秀的特征提取能力。
2.Neck:它采用了多尺度特征融合技术,将来自Backbone的不同阶段的特征图进行融合,以增强特征表示能力。具体来说,YOLOv8的Neck部分包括一个SPPF模块、一个PAA模块和两个PAN模块。
3.Head:它负责最终的目标检测和分类任务,包括一个检测头和一个分类头。检测头包含一系列卷积层和反卷积层,用于生成检测结果;分类头则采用全局平均池化来对每个特征图进行分类。
网络结构图:
二:Backbone
YOLOv8的Backbone部分使用了C2f模块来替代了YOLOv5中的C3模块,实现了进一步的轻量化。具体来说,同时,它也保留了YOLOv5等架构中使用的SPPF(空间金字塔池化)块。
1.预处理
提取初步特征的第一个卷积层的卷积核kernel,yolov5为6x6, yolov8为3x3,感受野相比于yolov5进一步缩小。
与yolov5一样,每个卷积层的模块都采用步长为2的卷积核进行降采样操作,减少特征图的尺寸同时增加通道数。
2.C3替换成C2f
yolov5中的C3模块在yolov8中被替换为了C2f,C2f则采用了yolov7中ELAN 多层堆叠的结构,增加了更多类似resnet残差块中的跳跃连接,丰富了模型的梯度流。
在C2f模块中用到的DarknetBottleneck模块,使用多个3x3卷积核进行卷积操作,提取特征信息,同时其具有add是否进行残差链接的选项。
而yolov5使用的Bottleneck是1×1和3×3卷积。
其实整个C2f模块就是一个改良版本的Darknet
首先,使用1x1卷积核将输入通道数减少到原来的1/2,以减少计算量和内存消耗。然后,使用多个3x3卷积核进行卷积操作,提取特征信息。接着,使用残差链接,将输入直接加到输出中,从而形成了一条跨层连接。最后,再次使用1x1卷积核恢复特征图的通道数。
yolo从v2起,backbone主要是Darknet。
三:Neck
Neck主要起到特征融合的作用,yolov8的neck依然采用PAN-FPN。
四:Head
YOLOv8采用了解耦头结构,将分类和检测任务分离开来。这种设计允许模型的每个部分专注于其特定的任务,提高了分类的准确性和检测的精确性。