【人脸表情识别】基于图片的人脸表情识别,基本概念和数据集

大家好,欢迎来到我们人脸表情识别的专栏,这是专栏的第一篇文章,今天我们讨论的问题是关于表情识别的基本概念和数据集。

                                            作者&编辑 | Menpinland

在较早之前,有三AI已经有一篇《人脸表情识别研究》的文章,里面已经对早期的人脸表情相关的内容做了一个较为详细的综述。但最近几年,由于深度学习技术的发展,以及越来越多大规模人脸表情识别数据集的开源,人脸表情识别的相关研究也发生了比较多的变化。本专栏将在前面综述的基础上,进一步介绍当前人脸表情识别的研究现状,同时跟踪该领域最新的研究成果。欢迎对此方向感兴趣或正在从事该领域相关研究的萌新、大佬提供意见和建议,一起学习,共同进步。

1 基本概念

有关表情的相关概述以及人脸表情识别的研究背景,可参考有三AI之前的综述:《【技术综述】人脸表情识别研究》,本文则不再赘述。

不过对于人脸表情识别的概念,此处进行补充。本专栏讨论的内容是通过计算机视觉技术识别人的面部表情以理解人的情绪状态,即人脸表情识别(Facial Expression Recognition)。但在笔者刚入坑查找相关文献的时候,发现有许多类似的词语,比如中文里面的“情绪识别”、”感情识别“,英文里面的”emotion“、”sentiment“、”affect“......其实之所以有这么多相似词语,主要是因为不同领域表达方式及使用习惯不同。研究及理解情绪人的情绪状态是一个很大的命题,除了面部表情,利用生理信号(如脑电信号、心跳、脉搏等)以及自然语言也可以理解人的情绪状态。在基于生理信号的情绪研究中,“emotion”、“affect”是比较常见的字眼;而在基于NLP的情绪研究中,“sentiment”则出现得更为频繁。也有相关学者对情绪识别领域里相似关键词的使用做了专门的研究 [1],有兴趣的读者可自行查看。

2 研究现状

在早期的人脸表情识别的研究中,大部分常用的数据集都是让研究人员或者专业的演员在实验室条件下(laboratory-controlled)进行“摆拍”获得的。但通过这样的数据集训练得到的算法模型在实际使用的时候很容易出现较大的偏差。最主要的原因在于这些表情数据都是在比较理想的实验室条件下得到的。跟其他人脸相关的任务一样,现实当中人脸会出现遮挡、头部姿态变换以及光照变换等更复杂的情况,除此之外,人在自然条件下的表情也不会有在实验室条件下通过“摆拍”得到的表情那么明显。因此,在理想条件下训练得到的算法模型面对现实更苛刻的条件,识别率自然大大下降。针对上述问题,越来越多自然环境下(in the wild)自发式的表情数据集也逐步开源,同时相关算法的研究也越来越偏向于去提升人脸表情识别在更具挑战性的现实条件下的鲁棒性。

图1|人脸表情识别存在的遮挡、头部姿态变换、光照变换问题

在人脸表情识别中,按照数据格式、表情定义类型的不同,可划分为更加细致的方向。按照数据格式划分,可分为基于图片的人脸表情识别以及基于(音)视频的人脸表情识别;按照表情定义类型的不同,可划分为基于离散标签的人脸表情识别,基于连续模型的人脸表情识别以及基于人脸活动单元系统(Facial Action Coding System, FACS)的人脸表情识别。基于离散标签的人脸表情识别就是将表情定义为六种基本的情绪:开心、悲伤、惊讶、害怕、厌恶、生气(通常七类多个中立,八类多个轻蔑),用分类的方法完成识别的任务,这也是目前大部分人脸表情识别研究;基于连续模型的人脸表情识别,就是按照心理学的效价-唤醒环形模型(Valence–Arousal circumplex model)[2] 将表情定义为两个连续的数值,用回归的方法完成人脸表情预测的任务;基于FACS的人脸表情识别,就是将人脸划分为多个活动单元(action unit, AU),将表情识别问题转换为判断哪几个活动单元“活跃(active)”的问题。以上各种分类都会在本专栏有所涉及。首先先介绍基于图片的人脸表情识别(没特别说明,后面相关介绍,人脸表情定义类型都默认离散标签)。

3 基于图片的人脸表情数据集

在介绍相关算法之前,我们首先去了解在基于图片的人脸表情识别使用得比较频繁的几个数据集:

1.The Japanese Female Facial Expression (JAFFE) Dataset [3]

链接:https://zenodo.org/record/3451524#.X2MFNG4zZPY

---数据采集方式:10位日本女性在实验室条件下摆拍指定表情获得

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立

---数据集大小:共213张图片,每个人每种表情大概3-4张图片,每张图片分辨率256*256像素

图2|JAFFE中部分图片示例

2.MMI Facial Expression Database [4,5]

链接:https://www.mmifacedb.eu/

---数据采集方式:32位参与者在实验室条件下摆拍指定表情获得

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立;AU;时序状态(表情开始帧-->峰值帧-->结束帧,onset-->apex-->offset)

---数据集大小:2900个视频以及740张图片,分辨率 720*576像素

图3|MMI中部分图片示例

3.Extended Cohn-Kanade Dataset (CK+) [6]

链接:http://www.pitt.edu/~emotion/ck-spread.htm

---数据采集方式:123位参与者在实验室条件下摆拍指定表情获得

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立、轻蔑;AU

---数据集大小:593个视频序列,分辨率640*490或者640*480,基于图片的人脸表情识别中常常取最后几帧作为样本

图4|CK+中部分图片示例

4.FER2013 [7]

链接:https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/overview

---数据采集方式:通过Google搜索引擎获取(这种即被定义为自然状态下自发式的表情数据)

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立

---数据集大小:训练集含28709张图片, 验证集含3589张图片,测试集含3589张图片,分辨率48*48,数据及标签存放在csv文件里

图5|FER2013中部分图片示例

5.Real-world Affective Faces Database (RAF-DB) [8]

链接:http://www.whdeng.cn/RAF/model1.html

---数据采集方式:采集自互联网

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立;复合情绪(可参考图6中的例子理解)

---数据集大小:总共29672张图片

图6|RAF-DB中部分图片示例

6.AffectNet [9]

链接:http://mohammadmahoor.com/affectnet/

---数据采集方式:采集自互联网

---表情标签:开心、悲伤、惊讶、害怕、厌恶、生气、中立;二维连续模型

---数据集大小:总计1800000张图片,其中450000是提供离散以及连续的标签,是目前自然条件下最大的表情识别图片数据集,也是提供二维连续模型标签中最大的数据集

图7|AffectNet中部分图片示例

4 参考文献

[1] Munezero M, Montero C S, Sutinen E, et al. Are they different? Affect, feeling, emotion, sentiment, and opinion detection in text[J]. IEEE transactions on affective computing, 2014, 5(2): 101-111.

[2] Russell J A. A circumplex model of affect[J]. Journal of personality and social psychology, 1980, 39(6): 1161.

[3] Lyons M, Akamatsu S, Kamachi M, et al. Coding facial expressions with gabor wavelets[C]//Proceedings Third IEEE international conference on automatic face and gesture recognition. IEEE, 1998: 200-205.

[4] Valstar M, Pantic M. Induced disgust, happiness and surprise: an addition to the mmi facial expression database[C]//Proc. 3rd Intern. Workshop on EMOTION (satellite of LREC): Corpora for Research on Emotion and Affect. 2010: 65.

[5] Pantic M, Valstar M, Rademaker R, et al. Web-based database for facial expression analysis[C]//2005 IEEE international conference on multimedia and Expo. IEEE, 2005: 5 pp.

[6] Lucey P, Cohn J F, Kanade T, et al. The extended cohn-kanade dataset (ck+): A complete dataset for action unit and emotion-specified expression[C]//2010 ieee computer society conference on computer vision and pattern recognition-workshops. IEEE, 2010: 94-101.

[7] Goodfellow I J, Erhan D, Carrier P L, et al. Challenges in representation learning: A report on three machine learning contests[C]//International conference on neural information processing. Springer, Berlin, Heidelberg, 2013: 117-124.

[8] Li S, Deng W, Du J P. Reliable crowdsourcing and deep locality-preserving learning for expression recognition in the wild[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2852-2861.

[9] Mollahosseini A, Hasani B, Mahoor M H. Affectnet: A database for facial expression, valence, and arousal computing in the wild[J]. IEEE Transactions on Affective Computing, 2017, 10(1): 18-31.

总结

本文首先介绍了人脸表情识别的相关概念以及研究现状,然后了解了目前基于图片的人脸表情识别领域最常用的几个数据集。后面的1-2篇专栏将会围绕近几年基于图片的人脸表情识别论文介绍相关的预处理以及识别的方法。

有三AI秋季划-人脸图像组

人脸图像小组需要掌握与人脸相关的内容,学习的东西包括8大方向:人脸检测,人脸关键点检测,人脸识别,人脸属性分析,人脸美颜,人脸编辑与风格化,三维人脸重建。了解详细请阅读以下文章:

【CV秋季划】人脸算法那么多,如何循序渐进地学习好?

转载文章请后台联系

侵权必究

往期精选

  • 【CV秋季划】模型优化很重要,如何循序渐进地学习好?

  • 【CV秋季划】人脸算法那么多,如何循序渐进地学习好?

  • 【CV春季划】170分钟学习OpenCV与经典图像处理算法基础

  • 【CV秋季划】人脸关键点检测,人脸识别视频更新

  • 【CV秋季划】人脸检测,活体人脸检测,伪造人脸检测视频更新

  • 【CV秋季划】人脸识别经典难题介绍,抗遮挡,跨年龄,异质源,少样本等

  • 【CV秋季划】人脸三维重建视频更新

  • 【CV秋季划】人脸年龄,表情,姿态等属性识别视频更新

  • 【CV秋季划】人脸美颜与风格化视频上新

  • 【CV秋季划】人脸编辑之统一属性编辑方法视频更新

  • 【CV秋季划】人脸编辑之表情,年龄,姿态编辑方法视频更新

  • 【CV秋季划】深度学习换脸算法视频更新

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28126.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【实战】深度学习构建人脸面部表情识别系统

实战:深度学习构建人脸面部表情识别系统 一、表情数据集 数据集采用了kaggle面部表情识竞赛的人脸表情识别数据集。 https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data 如果数据下载不下来的话&…

icon图标在线制作生成的方法

我们在实际的建站过程中,经常需要制作自己的icon图标文件;又或者我们需要把windows系统里的应用图标改成自定义的图标样式,那么有什么办法能够快速的将一张普通图片经过裁剪等操作后,制作生成一张icon图标文件呢,参考这…

如何给生成的exe加图标

一、简述 今天就简单介绍一下如何给exe加图标,其实很简单,但是主要是为了讲述另一个问题,这也是之前遇到的一个容易忽略的问题。 首先我们了解一下一共有多少个图标可以设置。 看到下面这张图,我们首先会了解到生成的一个exe程…

一键生成iosandroid应用图标

用的在线工具: https://toool.top/app-icon-generate 只需要准备一张 1024 x 1024 的图片 即可生成各个分辨率的应用图标 ,十分方便

奇舞周刊第 488 期:一个服务端同学的 Vue 框架入门及实践

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ 一个服务端同学的 Vue 框架入门及实践 做为服务端同学,接触前端代码较少,刚毕业的时候用过 jQuery Bootstrap2/3,当时的感觉就是,容…

国内站的ai聊天网站

国内站的ai聊天网站 网站如下: https://chat-gpt.org/chat其他网站如下: 在线体验ChatGPT网站集合 UI与官方相似https://chat.theb.ai/https://chatgpt-35-turbo.com/https:

Threads实测:和推特很像,马斯克大呼不讲武德

自从马斯克买下了推特,这个全球最大的在线社区就永远不缺少乐子,马斯克的整活能力在全球网红中都算是顶尖的。只不过,以前他只能在自己的推特账号那一亩三分地上整活,把推特买回家后,整个推特都变成了他的“乐园”。前…

AIGC明星独角兽爆雷!7亿融资烧大半,拖欠员工工资,创始人被扒得千疮百孔...

丰色 萧箫 发自 凹非寺 Stable Diffusion背后团队创始人,被曝巨大丑闻! 这两天,福布斯发布的一则长新闻在网上病毒式传播: 30多位前员工投资人现身说法,细数Stability AI老板Emad Mostaque(伊玛德莫斯塔克&…

马化腾聊天截图,被疯狂转发。

推荐阅读: 《在一个公司死磕了 5~10 年的人最后都怎么样了?》 《西安,被误解为贼城似乎是一件很正常的往事......》 1 裁员 前一段时间,一个有大佬九边,写了一篇关于裁员的文章,被马化腾给转发了&#xff0…

在「机器人领域」使用ChatGPT提高生产力

最近几个月,ChatGPT 大火,它是OpenAI于去年11月底推出的人工智能聊天机器人程序,已经成为了历史上增长最快的消费者应用程序 [1]。毫无疑问,ChatGPT受到了各个行业的广泛关注。 其中在机器人领域,微软于今年2月20日发布…

2020年一线城市程序员工资大调查

趋势 从趋势上看,基本上一线城市的工资都是上升的趋势。 人才需求 一线城市共发布岗位38115个,招聘120827人。 其中 beijing 22805 guangzhou 25081 shanghai 39614 shenzhen 33327 工资分布 2020年中国一线城市程序员的平均工资为16285元&#xff…

人工智能,落地为王!深圳人工智能企业百强榜超七成为应用层

中国工程院院士、香港中文大学(深圳)校长徐扬生认为,深圳具有完备的制造产业链,包括制造机器人的产业链,为设计、开发、制造人工智能系统提供了得天独厚的条件,这也不难理解为何深圳AI企业百强榜中超七成为应用层了。 人工智能作为…

致敬我在深圳大学的C++启蒙老师,跟着他学计算机编程就对了 (文末赠书5本)

致敬我的C启蒙老师,跟着他学计算机编程就对了 摘要 讲述了一个故事,介绍了一位良师,一段因C而续写的回忆,希望对各位看官有所帮助和启发。 文章目录 1 写在前面2 我的C启蒙老师3 谈谈老师给我的启发4 友情推荐5 文末福利 1 写在前…

本周杭州程序员工资大调查,高于深圳和广州

今天晚上11点,爬了某招聘网站,获取近7日内杭州的程序员工资2344条。其中,有工资的2275条。本文分别统计了工资的分布,工资和学历,工作经验和公司的性质,规模,产业的关系。 这里的程序员包括普通…

不得不说的Telegram : 币圈与链圈的微信

如果让你在「大而全的应用」和「小而美的应用」之间选一个,你会选择哪一个?你可以带着这个问题来阅读这篇软件体验报告,今天的主角是一款 IM 软件:Telegram Telegram Messenger 是一个跨平台的实时通讯软件,它的客户端…

再次来到爱丁堡

工作了几年后,作为访问学者再次来到爱丁堡。 出国访学有下面几个原因: 不太喜欢国内的科研环境。太浮躁,杂事也多。没有几个真正想搞学术的,大部分学术圈的人要么躺平,要么天天想着快速捞名利,我那个差单位…

【2020年领域新星】 赵彦鹏 爱丁堡大学

【2020年领域新星】赵彦鹏,爱丁堡大学语言、认知和计算研究所博士生,导师是Ivan Titov和Mirella Lapata教授。研究兴趣是结构预测和隐变量模型,现在主要关注语言结构和图像结构的学习,以及二者之间的联系。论文“Visually Grounde…

InstructGPT高效实践——【DeepSpeed-Chat】源码详解(2/3):Supervised Finetuning、Reward Model Finetuning

目录 前言1 phase-1: Supervised Finetuning1.1 训练数据样例1.2 训练过程1.3 关键代码详解1.3.1 基座模型结构1.3.2 LoRA结构及其正向传播1.3.3 phase1的指标评估 1.4 实例测试1.5 相关拓展1.5.1 多轮对话性能1.5.2 本阶段训练更倾向过拟合 1.6 版块相关问题 2 phase-2: Rewar…

NEWS|药物发现公司正在定制ChatGPT:方法如下

大型语言模型正在帮助科学家与人工智能交谈,甚至产生潜在的药物靶点。 近几个月来,世界大部分地区都被OpenAI的ChatGPT等文本生成引擎的出现所震惊,人工智能(AI)算法能够生成看起来像是由人类编写的文本。虽然像微软和…

ChatGPT强势加入芯片设计!不用学专业硬件描述语言了,说人话就行

西风 发自 凹非寺量子位 | 公众号 QbitAI 和ChatGPT聊聊天,就可解决CPU开发过程中的一大难题? 纽约大学(NYU)研究人员完成了一件看似不可能的事情: 无需专业的硬件描述语言(HDL),仅靠…