一个3x3的卷积核对6X6的图像进行卷积,得到一个4x4的图像
此时,生成图像长或宽 l=n-f+1
使用过滤器对图像进行卷积出现的问题有:
每次卷积后图像都会变小,当网络过深的时候,就会遗失许多像素
过滤器对边缘像素访问仅一次,对中间像素访问较多,会遗失边缘细节
为解决以上问题,对图像进行填充
对原图像进行填充后,利用滤波器进行卷积后的图像长或宽变成了:l=n+2p-f+1
此时,输出图像大小与原图大小一致,并且边缘像素与输出图像的更多像素有关
卷积分为valid和same类型
valid类型:不对图像进行填充,输出图像 l=n-f+1
same类型:对图像进行填充,使输入输出图像大小相同 l=n+2p-f+1即n+2p-f+1=n,可对p求解
在计算机视觉中,过滤器大小通常是奇数
步幅
有时候为了高效计算或是缩减采样次数,卷积窗口可以跳过中间位置,每次滑动多个元素。
将每次滑动元素的数量称为步幅(stride)
输入元素无法填充满窗口时,则舍弃
-
填充可以增加输出的高度和宽度。这常用来使输出与输入具有相同的高和宽。
-
步幅可以减小输出的高和宽,例如输出的高和宽仅为输入的高和宽的1/n(n是一个大于1的整数)。
-
填充和步幅可用于有效地调整数据的维度