1、物体检测经典方法
- two-stage(两阶段):Faster-rcnn Mask-Rcnn系列
- one-stage(单阶段):YOLO系列
- 最核心的优势:速度非常快,适合做实时检测任务!
- 但是缺点也是有的,效果通常情况下不会太好!
2、机器学习分类任务评价指标
机器学习 分类任务 评价指标
3、yolo-v1简介
- 经典的物体检测算法
- You Only Look Once,名字就已经说明了一切
- 把检测问题转化为回归问题,一个CNN就搞定了
- 可以对视频进行检测,应用领域非常广
只需要一个起始位置坐标,加上长和宽,就能把一个物体框出来了,这就是转化为回归问题
yolo算法,在当时15、16年等了很久,因为Faster R-CNN精度高,但是太慢了,速度在当时比精度更重要
4、yolov1预测流程
- 把图像分词S*S个格子
- 遍历每个格子,如果哪一个物体的中心点落在了这个格子,那么这个格子就负责预测这个物体
- 得到了若干个格子,遍历每一个格子
- 根据当前的格子都生成两个候选框,找出一个接近的框
- 现在有了一个这个物体的位置,需要调整框的长宽来得到最终结果
- 在调整的过程中会得到很多个候选框,每个候选框都会得到一个confidence值(即置信度,这个置信度表示了当前框住的部分是否是一个我们需要检测的物体)
- 置信度低的框会被过滤掉(因为目标格子可能会有多个,但是不一定都符合)
总结:
首先输入就是一个S*S个格子,每一个格子都产生两个候选框,产生两个候选框进行微调,但是不是所有候选框都进行微调,需要切实有物体的,什么时候有物体,通过执行度来判断
5、整体网络架构
输入图像是一个448*448,是一个固定值,这个固定值是通过openCVresize到固定值得,里面的物体会进行缩放,最后的框会映射到一个完整的原始图像中