图片与标注数据在 COCO官网 均提供下载
标注格式
COCO 的标注中包含 4 个部分/字段,"info" 描述数据集,"licenses" 描述图片来源,"images" 和 "annotations" 是主体部分
"images" 部分是一个列表,每一项是一张图片的基本信息与图片 ID,ID是为了方便 annotation 回溯对应图片,该部分格式如下:
[{
"license": 3,
"file_name": "000000017905.jpg",
"coco_url": "http://images.cocodataset.org/val2017/000000017905.jpg",
"height": 640,
"width": 480,
"date_captured": "2013-11-16 18:01:33",
"flickr_url": "http://farm1.staticflickr.com/44/173771776_53b9c22bb6_z.jpg",
"id": 17905
}, ···]
id: 图片 ID,对应 annotation 中的 image_id
"annotations" 部分是一个列表,每一项是一个对象(人体、汽车等等)的一条标注,该部分格式如下:
"segmentations":
"num_keypoints": 17
"area":
"iscrowd":
"keypoints": [x1,y1,vis1, ···],
"image_id": 17905,
"bbox": [81.27, 229.19, 119.39, 364.68],
"category_id": 1,
"id": 2157397
keypoints: 特征点坐标与可见性,相当于 MPII 的 joints+joints_vis,共17个个特征点,长度3*17。可见性对应关系为 { 0: "不可见", 1: "遮挡", 2: "可见" }。index与特征点对应关系如下
0: "nose", 1: "left_eye", 2: "right_eye", 3: "left_ear", 4: "right_ear", 5: "left_shoulder", 6: "right_shoulder", 7: "left_elbow", 8: "right_elbow", 9: "left_wrist", 10: "right_wrist", 11: "left_hip", 12: "right_hip", 13: "left_knee", 14: "right_knee", 15: "left_ankle", 16: "right_ankle"
image_id: 图片 ID
bbox: [l, t, w, h] 格式的 bounding box
category_id: 标注对象的类别,如果是 1 则是人体,选入姿态估计任务的数据
id: 每一条标注数据的ID