文章目录
- 一、含义
- 二、与传统检测对比
- 1.one-stage的优缺点
- 2.two-stage的优缺点
- 三、MAP指标
- 1.基本概念
- 2.计算方法
- 3.指标意义
一、含义
YOLO(You Only Look Once)是一种基于深度学习的目标检测算法,由Joseph Redmon等人于2016年提出。它的核心思想是将目标检测问题转化为一个回归问题,通过一个神经网络直接预测目标的类别和位置。YOLO算法将输入图像分成SxS个网格,每个网格负责预测该网格内是否存在目标以及目标的类别和位置信息。此外,YOLO算法还采用了多尺度特征融合的技术,使得算法能够在不同尺度下对目标进行检测。
二、与传统检测对比
相比于传统的目标检测算法,如R-CNN、Fast R-CNN和Faster R-CNN等,YOLO算法具有更快的检测速度和更高的准确率。这得益于其端到端训练方式和单阶段检测的特性,使其可以同时处理分类和定位任务,避免了传统方法中的多阶段处理过程。因此,YOLO算法广泛应用于实时目标检测和自动驾驶等领域。
1.one-stage的优缺点
- 优点:识别速度非常快,适合做实时检测任务
- 缺点:正确率相比较低
FLOPS表示模型进行一次前向传播(即处理一张图像)所需要的浮点运算次数。它是一个衡量算法效率的关键指标,与模型的计算量和推断速度密切相关。
FPS:每秒可以处理的图像数量。
2.two-stage的优缺点
- 优点:正确率比较高,识别效果理想
- 缺点:识别速度比较慢,通常达到5FPS
两阶段目标检测器是一种先生成候选框,然后对候选框进行分类和回归的检测方法。这种方法主要包括两个阶段: - 第一阶段:生成候选框。这通常通过一个类似于Selective Search或EdgeBoxes等区域提名算法来实现,该算法从输入图像中生成多个候选框。每个候选框都会经过一个CNN模型进行特征提取,然后通过分类器进行过滤,保留与目标物体更相似的候选框。
- 第二阶段:在保留的候选框上进行精细的分类和回归。这个阶段通常使用另一个CNN模型或类似SVM的分类器来进行分类和回归。对于每个候选框,可能需要预测物体的类别、位置和大小等。代表性的两阶段目标检测器包括R-CNN系列,以及其改进版本Fast R-CNN、Faster R-CNN和Mask R-CNN等。
三、MAP指标
1.基本概念
MAP指标是一种评估目标检测算法性能的指标,全称为mean Average Precision(平均准确率均值)。它综合衡量了检测效果,包括精度和召回率等,是精度和召回率的交点与原点形成的矩形的面积。
2.计算方法
- 首先,计算IOU值,IOU是预存框与真实框交集与并集的比值,如下图:
- 然后将预测的边界框与真实标签进行比较,并根据IOU(Intersection over Union,交并比)值将它们分类为TP(真正例)、FP(假正例)和FN(假反例)。
- 最后,根据每个类别的精度和召回率计算AP(Average Precision,平均准确率)。AP是PR曲线下的面积,其中PR曲线是以Precision(查准率)为纵坐标、Recall(召回率)为横坐标的坐标系下绘出的曲线。
根据不同的阈值,绘制出召回率和精确率的曲线,将曲线以下的面积作为MAP值。当MAP值越大,则表示指标越好 。
- 最后,将所有类别的AP值相加再除以类别总数,得到最终的MAP值。
3.指标意义
MAP指标可以用于评估模型在不同类别上的性能,并可以用于比较不同模型之间的性能。在目标检测任务中,高的MAP值通常表示模型具有较好的性能。具体来说,MAP值越大,说明模型的检测精度越高,性能越好。