论文题目::《VGGFace2: A dataset for recognising faces across pose and age》
论文地址:https://arxiv.org/pdf/1710.08092.pdf
1. 简介
VGGFace2是一个大规模人脸识别数据集,包含331万图片,9131个ID,平均图片个数为362.6。这个数据集有以下几个特点:
1)人物ID较多,且每个ID包含的图片个数也较多。
2)覆盖大范围的姿态、年龄和种族。
3)尽可能地使噪声最少。
该数据集是从谷歌中下载的,包含不同姿态、年龄、光照和背景的人脸图片,其中约有59.7%的男性。除了身份信息之外,数据集还包括人脸框,5个关键点、以及估计的年龄和姿态。下图为VGGFace2和其它人脸数据集的具体指标对比:
数据集分为训练集和评测集,其中训练集包含8631类,评测集包含500类。评测场景可以按姿态和年龄模板分为两类,模板由5张姿态/年龄接近的同一ID的人脸图片组成,如下图所示:
姿态模板:
年龄模板:
数据的收集和清理工作,由手动和自动完成(清理工作值得借鉴):
2. 实验
作者使用了ResNet-50和SE-ResNet-50网络分别在VGGFace/VGGFace2/MS-Celeb-1M上进行训练,在IJB-A上进行测试和对比人脸识别性能。实验证明,相同网络在VGGFace2上训练的识别模型在1:1比对和1:N搜索均取得了更好的结果,进一步地,将MS-Celeb-1M和VGGFace2结合(使用MS-Celeb-1M做预训练,再使用VGGFace2做finetune),SE-ResNet-50能够取得最佳的识别结果。(实验也证明了SE-ResNet-50的优越性能,需要在自己的实验中应用一下)