论文:AgeNet: Deeply Learned Regressor and Classifier for Robust Apparent Age Estimation
ICCV2015
论文提出了一种基于人脸的年龄识别网络AgeNet。该网络同时基于分类和回归对年龄进行预测,然后将2个分支的特征进行融合,得到更好的预测结果。并且在ChaLearn 2015 Apparent Age Competition 取得了最好的结果。
主要贡献:
- 提出了端到端的年龄识别方案AgeNet,并且了融合了回归和分类2个模。训练过程中,分别基于年龄数值进行回归,基于年龄的高斯分布作为label进行分类。
- 为了减少小数据上的过拟合,使用了迁移学习的策略。
- 取得了ICCV2015 Looking at People Challenge - Track 1 Apparent Age Estimation 第一名的成绩
整体网络结构:
使用的主干网络结构为GoogLeNet ,
网络结构的修改包括,去掉多余的2个loss层。在每一个Relu操作之前,增加BN操作,去除所有的dropout。
Label制作:
年龄的训练标签,可以使用下面3种方式表示。
(1)1-dimension real-value encoding,就是使用具体的一维数值表示
(2)0/1 encoding,使用one-hot形式表示
(3)Label distribution encoding,基于分布表示,
j表示按照时间顺序的年龄,比如0到85,
y表示标签,
σ 表示label的标准差,
最终标签分布如下,
Loss函数:
回归,
分类,
训练流程:
首先使用CASIA-WebFace 进行人脸识别训练。然后使用CACD ,Morph-II ,WebFaceAge 进行真实年龄的微调。最后使用Morph-II 进行表面年龄的微调。
人脸预处理:
(1)Face Detection 人脸检测
(2)Facial Landmark Localization 人脸关键点定位,包括左眼中心,右眼中心,鼻子尖,嘴巴左角,嘴巴右角。
(3)Face Normalization 人脸标准化,论文采用了基于外部(Exterior )和内部(Interior )的2种人脸标准化方法。
基于Exterior 的方法,既包括了外部的信息,也包括了全面的纹理信息。
基于organs 的方法,仅仅包括了内部的人脸五官。
2种方法都将人脸归一化到256*256大小。
集成学习:
(1)模型集成Model Ensemble ,将分类和回归进行集成。
(2)人脸模板集成Face Template Ensemble,采用不同的人脸标准化方法,不同的crop大小。
实验结果: