1、研究背景及意义
1)对yolo进行创新,准确度更高。
2、创新点
1)主要是更换了主干网络,使用了多尺度特征融合。
3、网络结构
yolo-V3以Darket-Net-53为主干网络。网络输入一张尺寸为416416的图片,经过多层卷积分别得到1313255、2626255、5252255的特征图,表示将原始图片分割得到的网格数量,分别用于检测大、中、小三种类型的物体。255=3(4+1+80),其中3表示每个网格对应3个anchor,4表示预测框的4个坐标位置信息,1表示objectness 分数(表示包含物体的可能性),80是coco数据集的类比数。
4、损失函数
1)正样本:只有与gt的iou最大的anchor为正样本。
2)负样本:与gt的iou低于阈值的anchor为负样本
3)什么也不是:与gt的iou超过阈值iou又不是最大的anchor。