CCPD 是一个在开源免费的中国城市车牌识别数据集。
1. 介绍
CCPD (Chinese City Parking Dataset, ECCV)是中国城市车牌数据集,共有两个CCPD2019和CCPD2020 数据集,总数据量约35W左右,可用于车牌检测和识别模型算法开发。
CCPD 发表的论文: https://arxiv.org/abs/1709.08828
CCPD2020 数据集包含约1万,主要是新能源绿牌数据。
CCPD2019数据集主要是蓝牌数据,将近34W 张图片、图片尺寸为720x1160x3,共包含8种类型图片,每种类型、数量及类型说明如下表:
类型 | 图片数 | 说明 |
---|---|---|
ccpd_base | 199998 | 正常车牌 |
ccpd_challenge | 10006 | 比较有挑战的车牌 |
ccpd_db | 20001 | 光线较暗或较亮车牌 |
ccpd_fn | 19999 | 距离摄像头较远或较近 |
ccpd_np | 3036 | 没上牌的新车 |
ccpd_rotate | 9998 | 水平倾斜20-50度,垂直倾斜-10-10度 |
ccpd_tilt | 10000 | 水平倾斜15-45度,垂直倾斜-15-45度 |
ccpd_weather | 9999 | 雨天、雪天或大雾的车牌 |
总共283037张车牌图像 |
CCPD2019车牌数据集拍摄的车牌照片的环境复杂多变,包括了倾斜、模糊、雨天、雪天等多个场景的数据,并且大部分图片有且仅含有一个车牌;由于采集人员主要在安徽省城市的停车场进行采集,导致大部分数据都是含【皖】的车牌图片,而其他省份的车牌比较少,而一些特殊车牌的数据就几乎没有,比如【挂使领民航危险品】这些车牌几乎没有。
1.1 车牌分布情况
下表给出CCPD数据各个省份的车牌数据统计:
2. 车牌号码说明
2.1 标识说明
车牌第一位是汉字:代表该车户口所在的省级行政区,为各(省、直辖市、自治区)的简称,比如:北京就是京,上海就是沪,湖南就是湘,重庆就是渝,山东就是鲁,江西就是赣,福建就是闽…;
车牌第二位是英文字母:代表该车户口所在的地级行政区,一般为各地级市、地区、自治州、盟字母代码,一般按省级车管所以各地级行政区状况分划排名:(字母“A”为省会、首府或直辖市中心城区的代码,其后字母排名不分先后);
另在编排地级行政区英文字母代码时,跳过I和O,O往往被用作警车或机关单位(军队、武警中的字母O等与此无关)。
序号 | 字段 | 详细 |
---|---|---|
1 | 省份 | |
provinces | [“皖”, “沪”, “津”, “渝”, “冀”, “晋”, “蒙”, “辽”, “吉”, “黑”, “苏”, “浙”, “京”, “闽”, “赣”, “鲁”, “豫”, “鄂”, “湘”, “粤”, “桂”, “琼”, “川”, “贵”, “云”, “藏”, “陕”, “甘”, “青”, “宁”, “新”] | |
2 | 地市 | |
alphabets | [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’, ‘G’, ‘H’, ‘J’, ‘K’, ‘L’, ‘M’, ‘N’, ‘P’, ‘Q’, ‘R’, ‘S’, ‘T’, ‘U’, ‘V’, ‘W’,‘X’, ‘Y’, ‘Z’] | |
3 | 车牌字典 | |
ads | [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’, ‘G’, ‘H’, ‘J’, ‘K’, ‘L’, ‘M’, ‘N’, ‘P’, ‘Q’, ‘R’, ‘S’, ‘T’, ‘U’, ‘V’, ‘W’, ‘X’,‘Y’, ‘Z’, ‘0’, ‘1’, ‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’] |
2.2 绿牌和蓝牌区别
颜色区别:小型新能源车牌采用“渐变绿”的配色,大型新能源车牌采用“黄绿双拼色”,绿牌的字体颜色为黑色;而传统燃油车蓝牌则采用“纯蓝色”设计,字体颜色为白色;
号码编排:普通蓝牌共有7位字符;新能源车牌有8位字符;新能源绿牌的号码共有6位数,其中小型新能源汽车牌照的字母设计在第一位,大型新能源汽车牌照的字母设计在最后一位。其中车牌首字母为“D/A/B/C/E”的,代表“纯电动车”;首字母为“F/G/H/J/K”的,代表“非纯电动汽车”。而普通燃油车蓝牌的号码只有5位数,首字母或数字一般不代表任何含义,只有部分地区会给营运类车型划分特定字母。
参考资料:
绿牌和蓝牌区别是什么?电动车上蓝牌好还是绿牌好-无敌电动
新能源电动汽车牌照和普通牌照区别介绍-有驾
3. CCPD 数据标注
为了完成这项任务,数据发布者首先在10k图像上手动标记四个顶点的位置。然后设计了一个基于深度学习的检测模型,在对该网络进行良好训练后,对每幅图像的四个顶点位置进行自动标注。最后,数据发布者雇用了7名兼职工人在两周内纠正这些标注。
CCPD提供了超过250k个独特的车牌图像和详细的注释。每张图像的分辨率为720(宽度)× 1160(高)× 3(通道)。实际上,这种分辨率足以保证每张图像中的车牌清晰可辨,但是该数据有些图片标注可能不准。不过总的来说CCPD数据集非常推荐研究车牌识别算法的人员学习使用。
CCPD车牌数据集标注了车牌四个角点,车牌水平和垂直角度以及车牌号码等信息,并以图片文件名的方式进行命名,如图片【025-95_113-154&383_386&473-386&473_177&454_154&383_363&402-0_0_22_27_27_33_16-37-15.jpg】,其文件名的含义如下:
序号 | 标识 | 含义 |
---|---|---|
1 | 025 | 车牌区域占整个画面的比例; |
2 | 95_113 | 车牌水平和垂直角度, 水平95°, 竖直113° |
3 | 154&383_386&473 | 标注框左上、右下坐标,左上(154, 383), 右下(386, 473) |
4 | 86&473_177&454_154&383_363&402 | 标注框四个角点坐标,顺序为右下、左下、左上、右上 |
5 | 0_0_22_27_27_33_16 | 车牌号码映射关系如下: 第一个0为省份 对应省份字典provinces中的皖;第二个0是该车所在地的地市一级代码,对应地市一级代码字典alphabets的A;后5位为字母和文字, 查看车牌号ads字典,如22为Y,27为3,33为9,16为S,最终车牌号码为皖AY339S |
4. 车牌数据集下载
CCPD官方原始数据集下载地址:https://github.com/detectRecog/CCPD
CCPD2019官方原始数据,主要是蓝牌数据,约34W;
CCPD2020官方原始数据,主要是新能源绿牌数据,约1万
CCPD车牌整理为 VOC 格式数据下载 :
百度云: 链接:https://pan.baidu.com/s/1yiFuRM4OtK-2SKi_QaBm7g 提取码:vb8o
(1)CCPD2019-voc将数据集CCPD2019转换为VOC数据格式(数据在Annotations,JPEGImages文件夹),可直接用于目标检测模型训练
(2)CCPD2020-voc将数据集CCPD2020转换为VOC数据格式(数据在Annotations,JPEGImages文件夹),可直接用于目标检测模型训练
为了方便后续训练车牌识别模型,数据集提供已经裁剪好的车牌图片,并放在plates文件夹。
5. 其他关联项目
…