ExpW表情数据集
- 1、数据集介绍
- 2、数据集处理
- 3、数据集下载
1、数据集介绍
论文《Deep Facial Expression Recognition: A Survey》里对其进行了介绍:
ExpW [47]: The Expression in-the-Wild Database (ExpW) contains 91,793 faces downloaded using Google image search. Each of the face images was manually annotated as one of the seven basic expression categories. Non-face images were removed in the annotation process.
我把数据集下载下来,统计了一下各类的分布情况不是很理想
angry | disgust | fear | happy | sad | surprise | neutral |
---|---|---|---|---|---|---|
3671 | 3995 | 1088 | 30537 | 10559 | 7060 | 34883 |
果然和其他网络爬取数据集一样,积极的较多,消极的较少,因为人们普遍倾向于发积极的图片,把悲伤留给自己:)
不过胜在数量还是可观的
该数据集对应的链接为http://mmlab.ie.cuhk.edu.hk/projects/socialrelation/index.html
论文不错,可以看一看
数据集百度云链接
2、数据集处理
数据集分图片和标签两部分,先看一下标签说明:
label.lst: each line indicates an image as follows:
image_name face_id_in_image face_box_top face_box_left face_box_right face_box_bottom face_box_cofidence expression_labelfor expression label:
"0" "angry"
"1" "disgust"
"2" "fear"
"3" "happy"
"4" "sad"
"5" "surprise"
"6" "neutral"@inproceedings{SOCIALRELATION_2017,author = {Zhanpeng Zhang, Ping Luo, Chen Change Loy, and Xiaoou Tang},title = {From Facial Expression Recognition to Interpersonal Relation Prediction},booktitle = {arXiv:1609.06426v2},month = September,year = {2016}
}
可见原数据集并没有将人脸提取出来,所以难怪原数据集有8个多G。
数据集还是有一些问题的,比如:
- 1、人脸倾斜
在表情识别中,人脸对齐是非常重要的,所以我对人脸进行了对齐操作
原图 | 根据标签提取的人脸 | 我对齐后的人脸 |
---|---|---|
- 2、无关数据
总有些与脸无关的数据,尽管Non-face images were removed in the annotation process.
比如:
原图 | 根据标签提取的人脸 |
---|---|
看了一下这张“脸”的label:
face_id_in_image是1,看来使用的人脸检测代码跑出来的第二张脸,所幸能从face_box_cofidence看出这张“脸”的置信度较低,于是我利用置信度阈值筛选掉了4488张图片。
被筛选掉的还有类似这样的图片
原图 | 根据标签提取的人脸 |
---|---|
筛选后的数据分布:
angry | disgust | fear | happy | sad | surprise | neutral |
---|---|---|---|---|---|---|
3585 | 3861 | 1053 | 29243 | 10039 | 6882 | 32642 |
我处理了数据集流程如下:
- 1、根据标签内容提取脸部图片
img_face = image[face_box_top:face_box_bottom, face_box_left:face_box_right, :]
- 2、对脸部图片进行关键点检测
- 3、通过关键点进行人脸对齐
- 4、保存人脸至各个类别
原数据集标签的人脸长宽比是不定的,我最终保存的图像是112x112x3大小
3、数据集下载
原数据集百度云链接,大概8个G
提取人脸(未筛选)
angry | disgust | fear | happy | sad | surprise | neutral |
---|---|---|---|---|---|---|
3671 | 3995 | 1088 | 30537 | 10559 | 7060 | 34883 |
下载链接
提取人脸(筛选)
angry | disgust | fear | happy | sad | surprise | neutral |
---|---|---|---|---|---|---|
3585 | 3861 | 1053 | 29243 | 10039 | 6882 | 32642 |
下载链接
有问题多交流,可留言可发邮件,我的邮箱是zhaodongyu艾特pku(这里换成点)edu.cn。