目录
- 1.函数签名:
- 2.学习中的疑问
- 3.代码
1.函数签名:
torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
2.学习中的疑问
Q:使用MaxPool2D池化时,当卷积核移动到某位置,该卷积核覆盖区域超过了输入尺寸时,MaxPool2D会如何处理?
A:
当使用MaxPool2D池化层时,当卷积核移动到某个位置,如果该卷积核的覆盖区域超过了输入的尺寸,MaxPool2D会进行以下处理:
-
部分覆盖: 如果池化窗口(卷积核)的中心点位于输入的边界附近,以至于窗口的一部分超出了输入边界,MaxPool2D将仅考虑在输入内部的部分窗口。这意味着池化窗口的超出部分不会被考虑在内,不会对池化结果产生影响。
-
Stride的作用: 池化层的
stride
参数决定了池化窗口在输入上移动的步幅。如果移动的步幅足够小,可以确保池化窗口在输入边界内的任何位置都能够被覆盖到。如果stride
过大,可能导致某些位置被漏掉或者部分覆盖。 -
填充: 在某些情况下,可以使用池化层的填充参数,通常为"valid"或"same"。"valid"表示没有填充,"same"表示在输入的周围填充以确保输出的尺寸与输入的尺寸相同。填充可以帮助确保所有区域都被合理处理。
总之,MaxPool2D通常会在输入的边界附近部分覆盖或舍弃,而不会扩展到超出输入边界的区域。要确保在处理边界附近的特征时不会出现信息丢失,可以适当设置stride
和填充参数,或者使用其他池化方法,如"same"填充或更复杂的边界处理策略。
3.代码
如下代码表明了MaxPool2D确实是只会考虑滤波器扫描到的输入数据里面的内容.
import torch
import torchvisionfrom torch.nn import Module,MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterinput = torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]],dtype=torch.float32)print("前",input.shape) # torch.Size([5, 5]),不满足输入的条件,需要进行格式转换input = torch.reshape(input,(-1,1,5,5))print("后",input.shape) # 后 torch.Size([1, 1, 5, 5]) 一个bach_size,class ConNet(Module):def __init__(self):super(ConNet, self).__init__()# 池化层使用,设置卷积核为3*3,超出的部分保留数据self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)def forward(self,input):output = self.maxpool(input)return output# 实例化对象
Work = ConNet()# 神经网络调用
output = Work(input)
print(output)