基于Python的人脸表情管理系统

人脸表情识别是深度学习领域的研究热点。在现实场景中,人脸图像的采集很容易受到外界不可控因素的影响,使表情图像出现轻微形变和局部位移的问题,导致表情识别率下降,难以满足实际需求。因此本设计针对静态人脸表情进行识别分类,提出了基于多通道输入的卷积神经网络(MCI-CNN)算法。
多通道输入的卷积神经网络(MCI-CNN)是由8个子模型构成。在测试过程中,将待测试的人脸图像经过随机裁剪、旋转等处理生成8张图片,并把这8张图片分别送入子模型中进行同时预测;将每个模型的预测结果,通过线性加权融合算法,得出最后的表情分类结果,提高了人脸图像轻微形变和局部位移的鲁棒性。每个子模型借鉴GoogleNet中1*1卷积的思想对AlexNet进行了改进,增加了模型的非线性表达能力;为了防止过拟合现象发生,对数据集进行数据增强处理和引入了dropout技术;针对模型训练效率的问题,采用了基于多线程随机shuffle队列的解决方法。
通过实验表明,MCI-CNN在fer2013表情库上取得了68.846%的识别率,比单个子模型多了2.7%的识别率,且识别率明显优于2013年人脸表情识别竞赛中其他方法,也印证了本设计算法的有效性。
关键词:人脸表情识别;卷积神经网络;MCI-CNN;TensorFlow
Abstract
Facial expression recognition is a research hotspot in the field of deep learning. In real-life scenarios, the collection of face images is easily affected by uncontrollable factors, causing slight deformation and local displacement of the expression images, resulting in a decrease in the expression recognition rate, which is difficult to meet the actual needs. Therefore, this design identifies and classifies static facial expressions, and proposes a multi-channel input convolutional neural network (MCI-CNN) algorithm.
The Multi-Channel Input Convolutional Neural Network (MCI-CNN) consists of eight sub-models. During the test, the face image to be tested is randomly cropped, rotated, etc. to generate 8 images, and the 8 images are respectively sent into the sub-model for simultaneous prediction; the prediction result of each model is linearized. The weighted fusion algorithm is used to obtain the final expression classification result, which improves the robustness of the slight deformation and local displacement of the face image. Each sub-model is improved by AlexNet's idea of ​​1*1 convolution in GoogleNet, which increases the nonlinear expression ability of the model; in order to prevent over-fitting, data enhancement processing and dropout technology are introduced; The problem of model training efficiency is based on a multi-threaded random shuffle queue.
Experiments show that MCI-CNN has achieved a recognition rate of 68.846% on the fer2013 expression database, 2.7% more recognition rate than the single sub-model, and the recognition rate is significantly better than other methods in the 2013 facial expression recognition competition. It also confirms the effectiveness of this design algorithm.
Key words: facial expression recognition; convolutional neural network; MCI-CNN; TensorFlow
目 录
摘 要 I
Abstract II
第一章 绪论 1
1.1 研究背景及意义 1
1.2 研究现状 1
1.3 本文研究的主要内容 3
第二章 人脸表情识别基础 4
2.1 常见的表情数据库 4
2.2 人脸识别 5
2.3 图像预处理 6
2.3.1 几何归一化 6
2.3.2 灰度归一化 8
2.3.3 直方图均衡化 8
2.4 主流人工智能框架 9
2.5 本章小结 10
第三章 多通道输入的卷积神经网络 12
3.1 CNN的基本原理 12
3.1.1 CNN的结构 12
3.1.2 激活函数 14
3.2 基于MCI-CNN的人脸表情识别算法 15
3.2.1 MCI-CNN网络架构 15
3.2.2 CNN模型结构及参数设置 16
3.3 本章小结 17
第四章 人脸表情识别的模型设计与分析 18
4.1 表情识别整体框图 18
4.2 数据集预处理 19
4.3 数据增强 20
4.4 模型训练的优化 23
4.4.1 TensorFlow读取数据的机制 23
4.4.2 基于多线程随机shuffle队列训练样本 24
4.5 实验结果分析与效果展示 25
4.6 本章小结 29
第五章 总结与展望 31
5.1 本文总结 31
5.2 未来展望 31
参考文献 33
致谢 35
附录 36
附录一 数据集预处理代码 36
附录二 CNN模型代码 38
附录三 模型训练代码 43
附录四 测试代码 48





 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28128.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Python的面部表情识别分析系统

资源下载地址:https://download.csdn.net/download/sheziqiong/85660758 面部表情识别 练习技能: 爬虫数据清洗计算机视觉(图片基本处理,信息提取)深度学习 图像识别技术文档 一、项目概述 项目名称:面部…

【人脸表情识别】基于图片的人脸表情识别,基本概念和数据集

大家好,欢迎来到我们人脸表情识别的专栏,这是专栏的第一篇文章,今天我们讨论的问题是关于表情识别的基本概念和数据集。 作者&编辑 | Menpinland 在较早之前,有三AI已经有一篇《人脸表情识别研究》的文章,里面已经…

【实战】深度学习构建人脸面部表情识别系统

实战:深度学习构建人脸面部表情识别系统 一、表情数据集 数据集采用了kaggle面部表情识竞赛的人脸表情识别数据集。 https://www.kaggle.com/c/challenges-in-representation-learning-facial-expression-recognition-challenge/data 如果数据下载不下来的话&…

icon图标在线制作生成的方法

我们在实际的建站过程中,经常需要制作自己的icon图标文件;又或者我们需要把windows系统里的应用图标改成自定义的图标样式,那么有什么办法能够快速的将一张普通图片经过裁剪等操作后,制作生成一张icon图标文件呢,参考这…

如何给生成的exe加图标

一、简述 今天就简单介绍一下如何给exe加图标,其实很简单,但是主要是为了讲述另一个问题,这也是之前遇到的一个容易忽略的问题。 首先我们了解一下一共有多少个图标可以设置。 看到下面这张图,我们首先会了解到生成的一个exe程…

一键生成iosandroid应用图标

用的在线工具: https://toool.top/app-icon-generate 只需要准备一张 1024 x 1024 的图片 即可生成各个分辨率的应用图标 ,十分方便

奇舞周刊第 488 期:一个服务端同学的 Vue 框架入门及实践

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ 一个服务端同学的 Vue 框架入门及实践 做为服务端同学,接触前端代码较少,刚毕业的时候用过 jQuery Bootstrap2/3,当时的感觉就是,容…

国内站的ai聊天网站

国内站的ai聊天网站 网站如下: https://chat-gpt.org/chat其他网站如下: 在线体验ChatGPT网站集合 UI与官方相似https://chat.theb.ai/https://chatgpt-35-turbo.com/https:

Threads实测:和推特很像,马斯克大呼不讲武德

自从马斯克买下了推特,这个全球最大的在线社区就永远不缺少乐子,马斯克的整活能力在全球网红中都算是顶尖的。只不过,以前他只能在自己的推特账号那一亩三分地上整活,把推特买回家后,整个推特都变成了他的“乐园”。前…

AIGC明星独角兽爆雷!7亿融资烧大半,拖欠员工工资,创始人被扒得千疮百孔...

丰色 萧箫 发自 凹非寺 Stable Diffusion背后团队创始人,被曝巨大丑闻! 这两天,福布斯发布的一则长新闻在网上病毒式传播: 30多位前员工投资人现身说法,细数Stability AI老板Emad Mostaque(伊玛德莫斯塔克&…

马化腾聊天截图,被疯狂转发。

推荐阅读: 《在一个公司死磕了 5~10 年的人最后都怎么样了?》 《西安,被误解为贼城似乎是一件很正常的往事......》 1 裁员 前一段时间,一个有大佬九边,写了一篇关于裁员的文章,被马化腾给转发了&#xff0…

在「机器人领域」使用ChatGPT提高生产力

最近几个月,ChatGPT 大火,它是OpenAI于去年11月底推出的人工智能聊天机器人程序,已经成为了历史上增长最快的消费者应用程序 [1]。毫无疑问,ChatGPT受到了各个行业的广泛关注。 其中在机器人领域,微软于今年2月20日发布…

2020年一线城市程序员工资大调查

趋势 从趋势上看,基本上一线城市的工资都是上升的趋势。 人才需求 一线城市共发布岗位38115个,招聘120827人。 其中 beijing 22805 guangzhou 25081 shanghai 39614 shenzhen 33327 工资分布 2020年中国一线城市程序员的平均工资为16285元&#xff…

人工智能,落地为王!深圳人工智能企业百强榜超七成为应用层

中国工程院院士、香港中文大学(深圳)校长徐扬生认为,深圳具有完备的制造产业链,包括制造机器人的产业链,为设计、开发、制造人工智能系统提供了得天独厚的条件,这也不难理解为何深圳AI企业百强榜中超七成为应用层了。 人工智能作为…

致敬我在深圳大学的C++启蒙老师,跟着他学计算机编程就对了 (文末赠书5本)

致敬我的C启蒙老师,跟着他学计算机编程就对了 摘要 讲述了一个故事,介绍了一位良师,一段因C而续写的回忆,希望对各位看官有所帮助和启发。 文章目录 1 写在前面2 我的C启蒙老师3 谈谈老师给我的启发4 友情推荐5 文末福利 1 写在前…

本周杭州程序员工资大调查,高于深圳和广州

今天晚上11点,爬了某招聘网站,获取近7日内杭州的程序员工资2344条。其中,有工资的2275条。本文分别统计了工资的分布,工资和学历,工作经验和公司的性质,规模,产业的关系。 这里的程序员包括普通…

不得不说的Telegram : 币圈与链圈的微信

如果让你在「大而全的应用」和「小而美的应用」之间选一个,你会选择哪一个?你可以带着这个问题来阅读这篇软件体验报告,今天的主角是一款 IM 软件:Telegram Telegram Messenger 是一个跨平台的实时通讯软件,它的客户端…

再次来到爱丁堡

工作了几年后,作为访问学者再次来到爱丁堡。 出国访学有下面几个原因: 不太喜欢国内的科研环境。太浮躁,杂事也多。没有几个真正想搞学术的,大部分学术圈的人要么躺平,要么天天想着快速捞名利,我那个差单位…

【2020年领域新星】 赵彦鹏 爱丁堡大学

【2020年领域新星】赵彦鹏,爱丁堡大学语言、认知和计算研究所博士生,导师是Ivan Titov和Mirella Lapata教授。研究兴趣是结构预测和隐变量模型,现在主要关注语言结构和图像结构的学习,以及二者之间的联系。论文“Visually Grounde…

InstructGPT高效实践——【DeepSpeed-Chat】源码详解(2/3):Supervised Finetuning、Reward Model Finetuning

目录 前言1 phase-1: Supervised Finetuning1.1 训练数据样例1.2 训练过程1.3 关键代码详解1.3.1 基座模型结构1.3.2 LoRA结构及其正向传播1.3.3 phase1的指标评估 1.4 实例测试1.5 相关拓展1.5.1 多轮对话性能1.5.2 本阶段训练更倾向过拟合 1.6 版块相关问题 2 phase-2: Rewar…