参考视频:https://www.youtube.com/watch?v=E5Z7FQp7AQQ&list=PLuhqtP7jdD8CD6rOWy20INGM44kULvrHu
视频7:CNN 的全局架构
卷积层除了做卷积操作外,还要加上 bias ,再经过非线性的函数,这么做的原因是 “scaled properly”
通常滑动窗口(filter) 不止一个,如下图
如下图是一个 CNN 的全部流程
如上图,经过两个卷积层后,最后得到的特征矩阵被展开成一维矩阵,传给人工神经网络(全连接层)。由于这是一个二元分类问题,output neuron 使用激活函数 sigmoid。
如果这是训练过程,那么在计算出预测值后,还要计算 cost function,接着进行反向传播算法来改变参数
需要注意的是,CNN 的反向传播算法非常复杂,这也是为什么我们要使用 pytorch, tensorflow 等框架来实现 CNN,而非手写
TODO:here