卷积神经网络CNN学习笔记-MaxPool2D函数解析

1.函数签名:

torch.nn.MaxPool2d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)
在这里插入图片描述

2.学习中的疑问

Q:使用MaxPool2D池化时,当卷积核移动到某位置,该卷积核覆盖区域超过了输入尺寸时,MaxPool2D会如何处理?
A:
当使用MaxPool2D池化层时，当卷积核移动到某个位置，如果该卷积核的覆盖区域超过了输入的尺寸，MaxPool2D会进行以下处理：

部分覆盖： 如果池化窗口（卷积核）的中心点位于输入的边界附近，以至于窗口的一部分超出了输入边界，MaxPool2D将仅考虑在输入内部的部分窗口。这意味着池化窗口的超出部分不会被考虑在内，不会对池化结果产生影响。
Stride的作用： 池化层的stride参数决定了池化窗口在输入上移动的步幅。如果移动的步幅足够小，可以确保池化窗口在输入边界内的任何位置都能够被覆盖到。如果stride过大，可能导致某些位置被漏掉或者部分覆盖。
填充： 在某些情况下，可以使用池化层的填充参数，通常为"valid"或"same"。"valid"表示没有填充，"same"表示在输入的周围填充以确保输出的尺寸与输入的尺寸相同。填充可以帮助确保所有区域都被合理处理。

总之，MaxPool2D通常会在输入的边界附近部分覆盖或舍弃，而不会扩展到超出输入边界的区域。要确保在处理边界附近的特征时不会出现信息丢失，可以适当设置stride和填充参数，或者使用其他池化方法，如"same"填充或更复杂的边界处理策略。

3.代码

如下代码表明了MaxPool2D确实是只会考虑滤波器扫描到的输入数据里面的内容.

import torch
import torchvisionfrom torch.nn import Module,MaxPool2d
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterinput = torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]],dtype=torch.float32)print("前",input.shape)      # torch.Size([5, 5])，不满足输入的条件，需要进行格式转换input = torch.reshape(input,(-1,1,5,5))print("后",input.shape)    # 后 torch.Size([1, 1, 5, 5]) 一个bach_size，class ConNet(Module):def __init__(self):super(ConNet, self).__init__()# 池化层使用，设置卷积核为3*3,超出的部分保留数据self.maxpool = MaxPool2d(kernel_size=3,ceil_mode=True)def forward(self,input):output = self.maxpool(input)return output# 实例化对象
Work = ConNet()# 神经网络调用
output = Work(input)
print(output)