论文报告-Linear Regression for face recognition

论文的英文题目、中文题目,作者;

英文题目 : Linear Regression for Face Recognition
中文题目 : 人脸识别的线性回归方法
作者 : Imran Naseem, Roberto Togneri, Mohammed Bennamoun

摘要翻译

本文提出了一种新的人脸识别方法,将模式识别问题转化为线性回归。利用单个对象类的模式位于线性子空间的基本概念,我们开发了一个线性模型,将探测图像表示为特定于类的库的线性组合。反问题采用最小二乘法求解,决策有利于重建误差最小的类。所提出的线性回归分类(LRC)算法属于最近子空间分类的范畴。该算法在多个标准数据库上根据人脸识别文献中报告的一些示例性评估协议进行了广泛评估。与最新算法的对比研究清楚地反映了所提出方法的有效性。针对连续遮挡问题,我们提出了一种模块化的LRCAPP算法,引入了一种新的基于距离的证据融合(DEF)算法。提出的方法实现了最好的结果有史以来的挑战性问题围巾闭塞报告。

论文的提出,也就是写作目的,作者要解决什么问题?

写作目的:

在本研究中,提出一种相当简单而有效的基于线性回归的分类方法(LRC)来解决人脸识别问题。已知来自特定对象类的样本位于线性子空间[3],[9]上。我们使用这个概念简单地使用下采样的图片库图像来开发注册用户的类特定模型,从而将人脸识别任务定义为一个线性回归问题。利用最小二乘估计方法,对给定探针的所有类模型进行参数向量估计。最后,决策规则有利于具有最精确估计的类。本文提出的分类器可以归类为最近子空间(NS)方法。

一个重要的相关工作在[8]中呈现,其中所有类的下采样图像被用于在训练期间开发字典矩阵。每个探测图像表示为所有画廊图像的线性组合,从而产生一个病态的逆问题。利用压缩感知和稀疏表示的最新研究成果,利用系数矢量的稀疏性利用1范数最小化来解决病态问题。在[10]中,局部线性回归(LLR)的概念被专门介绍来解决姿态的问题。该研究的主要目的是指出一个非正面面部图像和它的正面对应图像之间的近似线性映射;线性映射的估计被进一步表述为一个基于回归的解决方案的预测问题。对于姿态变化严重的情况,对非正面图像进行采样,得到许多重叠的局部分割。对每个小patch进行线性回归,预测对应的虚拟额叶patch;在粗对准存在的情况下,LLR方法显示了一些良好的结果。在[11]中,采用了两步的方法,融合了小波分解和判别分析的概念,设计了一个复杂的特征提取阶段。这些鉴别特征用于开发特征平面(对于最近的特征平面- NFP分类器)和特征空间(对于最近的特征空间- nfs分类器)。将查询图像投影到子空间和决策规则上,并以距离最小的子空间为目标。然而,本文提出的LRC方法首次简单地将下采样图像与线性回归分类相结合,从而获得比基准技术更好的结果。

此外,对于严重连续遮挡的问题,一种模块化的图像表示有望解决问题[12]。基于这一概念,我们提出了一种有效的模块化LRC方法。该方法对给定的被遮挡图像进行分割,并对每个块进行单独的分割。使用基于noveldistance的证据融合(DEF)算法将这些中间决策结合起来,以获得最终决策。提出的DEF算法使用中间决策的距离度量来决定分区的“好坏”。使用DEF方法有两个主要优点。首先,动态拒绝非面分区;因此,他们不参与最终的决策。其次,由于人脸分割的有效决策融合,整体识别性能优于组合分割的最佳单个结果。

解决问题的方法(详细介绍)

线性回归分类算法
LRC算法的模块化方法 :
利用模块化表示方法[12]可以有效地解决识别部分遮挡人脸的问题。在某种意义上,相邻遮挡可以安全地假定为局部的,即它只损坏图像的部分相邻像素,污染的数量未知。在模块化方法中,我们利用污染像素的邻域特性,将人脸图像分割成若干个子图像。现在每个子图像都被单独处理,最后通过融合所有子图像的信息来做出决定。通常报道的决策融合技术是多数投票[12]。然而,多数投票制的一个主要缺陷是,它对嘈杂的分区和干净的分区一视同仁。例如,如果一个图像的四个分区中有三个分区被破坏,多数投票可能是错误的,无论干净的分区在面部特征的背景下可能是多么重要。由于遮挡在人脸图像上的分布从来不是先验的,因此,连同人脸和非人脸子图像,我们很可能有人脸部分被遮挡破坏,这一事实使任务变得更加复杂。已经开发了一些复杂的方法来过滤掉潜在的污染图像像素(例如,[17])。在本节中,我们利用距离分类的特性,开发了一种相当简单但有效的融合策略,该策略隐式去强调损坏的子图像,显著提高了整体分类精度。我们建议使用距离度量作为证据,我们相信对子图像采取的中间决策的“良”;这种方法被称为“基于距离的证据融合”。

实验结果 :
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

论文的创新在什么地方?

采用了两步方法,融合了小波分解和判别分析的概念。
LRC方法首次简单地使用降采样图像与线性回归分类相结合,以获得更好的结果。
这些中间决策使用一种新的基于距离的证据融合(DEF)算法进行组合,以达到最终决策。

方法的效果和局限性?

在本研究中,提出一种新的分类算法,将人脸识别任务化为线性回归问题。本文提出的LRC算法使用最标准的数据库进行了广泛的评估,并采用了人脸识别文献中报道的各种评估方法。具体来说,不同的面部表情和连续遮挡的挑战被解决。相当多的比较分析与最先进的算法清楚地反映了所提出的方法的效力。提出的LRC方法揭示了许多有趣的结果。除了使用模块化LRC方法进行伪装人脸识别外,LRC方法无需任何预处理步骤进行人脸定位和/或归一化,具有较高的识别精度。我们认为,在非理想条件下,如遮挡、光照和严重的手势,裁剪和对齐的脸通常是不可用的。因此,与未处理的标准数据库保持一致的可靠性能使得LRC算法适合于真实场景。对于不同的手势,LRC方法已经被证明能够很好地处理最严重的尖叫表情,这是最先进的技术落后的地方,表明轻微和严重的变化是一致的。针对存在伪装的人脸识别问题,采用高效证据融合策略的模块化LRC算法获得了文献中报道的最佳结果。在基于视图的人脸识别范式中,对特定案例的特征选择一直是一个有争议的话题。然而,最近的研究显示了非正统特征的能力,如下采样图像和随机投影,表明了与传统意识形态[8]的背离。提出的LRC方法实际上符合这一新兴信念。结果表明,通过选择适当的分类器,下采样图像比传统方法具有较好的效果。该方法的简单架构使其计算效率很高,因此很适合基于视频的人脸识别应用。其他未来的方向包括与照明、随机像素损坏和姿态变化相关的鲁棒性问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29213.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文笔记:Mind-the-Gap,Unsupervised Domain Adaptation for Text-Video Retrieval

小心空隙!文本视频检索中的无监督域自适应 摘要介绍方法总体框架Concept Preservation 结论 摘要 什么时候我们可以期望文本视频检索系统在不同于其训练域的数据集上有效地工作?在这项工作中,我们通过无监督的领域适应的视角来研究这个问题&…

“detail“: “Unsupported media type \“text/plain\“ in request.“

在使用 Postman 的过程中,使用 POST 请求传输数据时,Postman 反馈如下错误 "detail": "Unsupported media type \"text/plain\" in request." 这是由于在传输数据过程中格式选择错误的原因 只要将右下角的 Text 格式转换为…

Dual-stream Network for Visual Recognition论文记录

太长不看版:作者提出了一种DS-net,受resnet启发,设置了4个stage,分别下采样为原图的4,8,16,32倍小。每个stage中含有不同数量的block,作用是可以将输入的tensor按照channel划分为两部…

图像超分辨率论文笔记

持续更新 Progressive Multi-Scale Residual Network for Single Image Super-Resolution 论文链接:https://arxiv.org/pdf/2007.09552.pdf代码:PMRN (暂未公开)发表时间:2020.7网络结构: 1)包…

【论文笔记】Exploring Temporal Coherence for More General Video Face Forgery Detection

* Exploring Temporal Coherence for More General Video Face Forgery Detection 题目:探索更一般的视频人脸伪造检测的时间相干性 1.概述 时间相干性网络组成: 第一阶段是一个全时间卷积网络(FTCN)。FTCN的关键见解是 将空间卷…

视频超分辨率论文笔记

持续更新 Video Super-Resolution via Deep Draft-Ensemble Learning 论文链接:http://openaccess.thecvf.com/content_iccv_2015/papers/Liao_Video_Super-Resolution_via_ICCV_2015_paper.pdf代码:http://www.cse.cuhk.edu.hk/leojia/projects/DeepS…

【超分辨率】SRCNN论文笔记

论文名称:Image Super-Resolution Using Deep Convolutional Networks 论文下载地址:https://arxiv.org/pdf/1501.00092.pdf 翻译参考:https://blog.csdn.net/PPLLO_o/article/details/90040801 1.论文概述 1.SRCNN算是深度学习在图像超分辨…

版面分析:[ICCV2017] Fast CNN-based document layout analysis

论文链接:https://openaccess.thecvf.com/content_ICCV_2017_workshops/papers/w18/Oliveira_Fast_CNN-Based_Document_ICCV_2017_paper.pdf 自动文档布局分析是认知计算和从文档图像中提取信息的过程中的关键步骤,如特定领域知识数据库创建、图形和图像…

论文笔记之数据增广(1):mixup

mixup:BEYOND EMPIRICAL RISK MINIMIZATION 文章:https://arxiv.org/pdf/1710.09412.pdf 代码:github 作者:张宏毅 mixupBEYOND EMPIRICAL RISK MINIMIZATION 摘要背景 引入贡献 方法 公式理解 实验讨论 摘要 如今大规模深度…

【图像超分辨率重建】——EnhanceNet论文精读笔记

2017-EnhanceNet: Single Image Super-Resolution Through Automated Texture Synthesis(EnhanceNet) 基本信息 作者: Mehdi S. M. Sajjadi Bernhard Scholkopf Michael Hirsch 期刊: ICCV 引用: * 摘要: 单一图像超分辨率是指从…

旷视CVPR2019图卷积多标签图像识别Multi-Label Image Recognition with Graph Convolutional Networks论文详解

背景:GCN刚出来,很多很容易想到的idea会被运用起来,很容易产生一些paper。我们解析此篇论文,了解其中原理,一来看看如何将图卷积应用于目前技术上,二来看到底如何快速的把准确率刷到state of the art以便发…

Hierarchical Modular Network for Video Captioning【论文阅读】

Hierarchical Modular Network for Video Captioning 发表:CVPR 2022代码:HMNidea:现有方法在有监督学习的框架下比较生成句子与标注,没有对语义有详尽的探索。基于此,作者考虑从三个层面来连接视频特征和语义&#x…

CVPR2019超分辨率文章:Meta-SR,任意输入upsample factor的超分辨率网络

论文地址 CVPR2019的新文章,主要是针对以前超分辨率问题中需要固定上采样因子的问题作出的改进。 摘要 随着DNN的发展,超分辨率技术得到了巨大的改进。但是,超分辨率问题中的任意scale factor问题被忽视了很久。前面的很多工作都是把不同s…

GAIDC大会:飞桨邀你来大模型技术与应用论坛

深度学习大规模预训练模型的兴起,以其极强的通用能力和突破性的效果,正推动通用人工智能(AGI)快速发展,并带来了AI研发应用新范式,逐步改变AI生态格局。近期以大规模语言模型为基础的技术工作,展…

人工智能大模型多场景应用原理解析

​强烈推荐一个大神的人工智能的教程:http://www.captainai.net/zhanghan 前言 在上篇文章《人工智能大模型之ChatGPT原理解析》中分享了一些大模型之ChatGPT的核心原理后,收到大量读者的反馈,诸如:在了解了核心原理后想进一步了解未来的发展…

3日行程安排

22号 13:30出发到峡山码头坐船--横山岛景区 峡山码头 船费:来回70r 固定开船时间:9:30,12:00,14:00 或者🈵️12人自动开船,最晚4点有船返回 岛上风景 逛山海“小普陀”寺庙普南禅院,被誉为宁…

托福备考经验心得

综述 托福备考准备经验与心得。全部都是个人的反思,带有个人的观点色彩,按需自取即可。首先是几个深刻的经验教训: 对备考的强度要有一个基本的把握,之前一方面在忙别的事情一方面备考感觉自己成效不是特别明显 (可能是我本人能…

初识托福TOEFL口语

对于想要准备托福的童鞋,并不怎么了解托福考试内容的可以看一看,本文主要给大家分享下托福考试中口语部分介绍。 托福考试中总共有4个部分,第一个部分是Reading(阅读),第二个部分是(Listening&…

chatgpt赋能Python-pycharm自动纠错

Pycharm自动纠错:提高开发效率,减少犯错 随着Python语言的流行,Pycharm成为了众多Python工程师的首选IDE之一。Pycharm具有丰富的功能,其中之一就是自动纠错。本文将介绍Pycharm自动纠错的优点和如何正确使用它来提高开发效率&am…

KFC - VME = 50

KFC - VME 50 CalHeightFromPointToPlane.java_spencer_tseng的博客-CSDN博客