目录
- 1.物体检测
- 边缘框
- 目标检测数据集
- 总结
- 边缘框代码实现
- 2.锚框:目标检测的一种方法
- IoU—交并比
- 赋予锚框标号
- 使用非极大值抑制(NMS)输出
- 总结
- 代码实现
1.物体检测
边缘框
- 一个边缘框可以通过四个数字定义
- (左上x,左上y),(右下x,右下y)
- (左上x,左上y,宽,高)
- (中间x,中间y,宽,高)
物体识别的数据集,比图片分类的数据集小很多,因为数据标注很费时间
目标检测数据集
- 每一行表示一个物体
- 图片文件名,物体类别,边缘框
- COCO:cocodataset.org 在图片分类中相等与ImageNet
- 80 物体,330K图片,1500000物体
总结
- 物体检测识别图片里的多个物体的类别和位置
- 位置通常用边缘框表示
边缘框代码实现
import torch
from d2l import torch as d2ld2l