一、卷积神经网络介绍
1、背景
随着人工智能需求的提升,我们想要做复杂的图像识别,做自然语言处理,做语义分析翻译等等,多层神经网络的简单叠加显然力不从心
2、卷积神经网络与传统多层神经网络对比
(1)传统意义上的多层神经网络是只有输入层、隐藏层、输出层。其中隐藏层的层数根据需要而定,没有明确的理论推导来说明到底多少层合适
(2)卷积神经网络CNN,在原来多层神经网络的基础上,加入了更加有效的特征学习部分,具体操作就是在原来的全连接层前面加入了卷积层和池化层
(3)卷积神经网络出现,使得神经网络层数得以加深,“深度”学习由此而来
(4)通常所说的深度学习,一般指的是这些CNN等新的结构以及一些新的方法(比如新的激活函数Relu等),解决了传统多层神经网络的一些难以解决的问题
(5)与传统多层神经网络对比
输入层
隐藏层
卷积层
激活层
池化层
全连接层
输出层
3、卷积神经网络发展历史
(1)最初由机器学习中人工神经网络发展而来
(2)1989年LeCun1989
(3)1998年LeNet
(4)2012年AlexNet,改进了很多
(5)加强功能
网络结构加深
加强卷积功能
从分类到检测
新增功能模块
3、卷积网络ImageNet比赛错误率
(1)ImageNet可以说是计算机视觉研究人员进行大规模物体识别和检测时,最先想到的视觉大数据来源,最初由斯坦福大学李飞飞等人在CVPR 2009的一篇论文中推出,并被用于替代PASCAL数据集(后者在数据规模和多样性上都不如ImageNet)和LableMe数据集(在标准化上不如ImageNet)
(2)ImageNet不但是计算机视觉发展的重要推动者,也是这一波深度学习热潮的关键驱动力之一
(3)截止2016年,ImageNet中含有超过1500万由人工注释的图片网址,也就是带标签的图片,标签说明了图片中的内容,超过2.2万个类别
二、卷积神经网络三个结构
1、一张图片经过一系列的卷积、激活、池化,最后有一个FC(全连接)
也是输出top-5 error
2、神经网络(neural networks)的基本组成包括输入层、隐藏层、输出层。而卷积神经网络的特点在于隐藏层分为卷积层和池化层(pooling layer,又叫下采样层)以及激活层
3、每一层的作用
(1)卷积层:通过在原始图像上平移来提取特征
相当于是拿着一个过滤器或者小窗口,通过在原始图片上平移来提取特征
(2)激活层:增加非线性分割能力
(3)池化层:减少学习的参数,降低网络的复杂度(最大池化和平均池化)
4、为了能够达到分类效果,还会有一个全连接层(Full Connection)也就是最后的输出层,进行损失计算并输出分类结果