论文的英文题目、中文题目,作者;
英文题目 : Linear Regression for Face Recognition
中文题目 : 人脸识别的线性回归方法
作者 : Imran Naseem, Roberto Togneri, Mohammed Bennamoun
摘要翻译
本文提出了一种新的人脸识别方法,将模式识别问题转化为线性回归。利用单个对象类的模式位于线性子空间的基本概念,我们开发了一个线性模型,将探测图像表示为特定于类的库的线性组合。反问题采用最小二乘法求解,决策有利于重建误差最小的类。所提出的线性回归分类(LRC)算法属于最近子空间分类的范畴。该算法在多个标准数据库上根据人脸识别文献中报告的一些示例性评估协议进行了广泛评估。与最新算法的对比研究清楚地反映了所提出方法的有效性。针对连续遮挡问题,我们提出了一种模块化的LRCAPP算法,引入了一种新的基于距离的证据融合(DEF)算法。提出的方法实现了最好的结果有史以来的挑战性问题围巾闭塞报告。
论文的提出,也就是写作目的,作者要解决什么问题?
写作目的:
在本研究中,提出一种相当简单而有效的基于线性回归的分类方法(LRC)来解决人脸识别问题。已知来自特定对象类的样本位于线性子空间[3],[9]上。我们使用这个概念简单地使用下采样的图片库图像来开发注册用户的类特定模型,从而将人脸识别任务定义为一个线性回归问题。利用最小二乘估计方法,对给定探针的所有类模型进行参数向量估计。最后,决策规则有利于具有最精确估计的类。本文提出的分类器可以归类为最近子空间(NS)方法。
一个重要的相关工作在[8]中呈现,其中所有类的下采样图像被用于在训练期间开发字典矩阵。每个探测图像表示为所有画廊图像的线性组合,从而产生一个病态的逆问题。利用压缩感知和稀疏表示的最新研究成果,利用系数矢量的稀疏性利用1范数最小化来解决病态问题。在[10]中,局部线性回归(LLR)的概念被专门介绍来解决姿态的问题。该研究的主要目的是指出一个非正面面部图像和它的正面对应图像之间的近似线性映射;线性映射的估计被进一步表述为一个基于回归的解决方案的预测问题。对于姿态变化严重的情况,对非正面图像进行采样,得到许多重叠的局部分割。对每个小patch进行线性回归,预测对应的虚拟额叶patch;在粗对准存在的情况下,LLR方法显示了一些良好的结果。在[11]中,采用了两步的方法,融合了小波分解和判别分析的概念,设计了一个复杂的特征提取阶段。这些鉴别特征用于开发特征平面(对于最近的特征平面- NFP分类器)和特征空间(对于最近的特征空间- nfs分类器)。将查询图像投影到子空间和决策规则上,并以距离最小的子空间为目标。然而,本文提出的LRC方法首次简单地将下采样图像与线性回归分类相结合,从而获得比基准技术更好的结果。
此外,对于严重连续遮挡的问题,一种模块化的图像表示有望解决问题[12]。基于这一概念,我们提出了一种有效的模块化LRC方法。该方法对给定的被遮挡图像进行分割,并对每个块进行单独的分割。使用基于noveldistance的证据融合(DEF)算法将这些中间决策结合起来,以获得最终决策。提出的DEF算法使用中间决策的距离度量来决定分区的“好坏”。使用DEF方法有两个主要优点。首先,动态拒绝非面分区;因此,他们不参与最终的决策。其次,由于人脸分割的有效决策融合,整体识别性能优于组合分割的最佳单个结果。
解决问题的方法(详细介绍)
线性回归分类算法
LRC算法的模块化方法 :
利用模块化表示方法[12]可以有效地解决识别部分遮挡人脸的问题。在某种意义上,相邻遮挡可以安全地假定为局部的,即它只损坏图像的部分相邻像素,污染的数量未知。在模块化方法中,我们利用污染像素的邻域特性,将人脸图像分割成若干个子图像。现在每个子图像都被单独处理,最后通过融合所有子图像的信息来做出决定。通常报道的决策融合技术是多数投票[12]。然而,多数投票制的一个主要缺陷是,它对嘈杂的分区和干净的分区一视同仁。例如,如果一个图像的四个分区中有三个分区被破坏,多数投票可能是错误的,无论干净的分区在面部特征的背景下可能是多么重要。由于遮挡在人脸图像上的分布从来不是先验的,因此,连同人脸和非人脸子图像,我们很可能有人脸部分被遮挡破坏,这一事实使任务变得更加复杂。已经开发了一些复杂的方法来过滤掉潜在的污染图像像素(例如,[17])。在本节中,我们利用距离分类的特性,开发了一种相当简单但有效的融合策略,该策略隐式去强调损坏的子图像,显著提高了整体分类精度。我们建议使用距离度量作为证据,我们相信对子图像采取的中间决策的“良”;这种方法被称为“基于距离的证据融合”。
实验结果 :
论文的创新在什么地方?
采用了两步方法,融合了小波分解和判别分析的概念。
LRC方法首次简单地使用降采样图像与线性回归分类相结合,以获得更好的结果。
这些中间决策使用一种新的基于距离的证据融合(DEF)算法进行组合,以达到最终决策。
方法的效果和局限性?
在本研究中,提出一种新的分类算法,将人脸识别任务化为线性回归问题。本文提出的LRC算法使用最标准的数据库进行了广泛的评估,并采用了人脸识别文献中报道的各种评估方法。具体来说,不同的面部表情和连续遮挡的挑战被解决。相当多的比较分析与最先进的算法清楚地反映了所提出的方法的效力。提出的LRC方法揭示了许多有趣的结果。除了使用模块化LRC方法进行伪装人脸识别外,LRC方法无需任何预处理步骤进行人脸定位和/或归一化,具有较高的识别精度。我们认为,在非理想条件下,如遮挡、光照和严重的手势,裁剪和对齐的脸通常是不可用的。因此,与未处理的标准数据库保持一致的可靠性能使得LRC算法适合于真实场景。对于不同的手势,LRC方法已经被证明能够很好地处理最严重的尖叫表情,这是最先进的技术落后的地方,表明轻微和严重的变化是一致的。针对存在伪装的人脸识别问题,采用高效证据融合策略的模块化LRC算法获得了文献中报道的最佳结果。在基于视图的人脸识别范式中,对特定案例的特征选择一直是一个有争议的话题。然而,最近的研究显示了非正统特征的能力,如下采样图像和随机投影,表明了与传统意识形态[8]的背离。提出的LRC方法实际上符合这一新兴信念。结果表明,通过选择适当的分类器,下采样图像比传统方法具有较好的效果。该方法的简单架构使其计算效率很高,因此很适合基于视频的人脸识别应用。其他未来的方向包括与照明、随机像素损坏和姿态变化相关的鲁棒性问题。