1. SPD-Conv介绍
1.1 摘要:卷积神经网络(CNN)在图像分类和目标检测等许多计算机视觉任务中取得了巨大的成功。 然而,在图像分辨率较低或物体较小的更艰巨的任务中,它们的性能会迅速下降。 在本文中,我们指出,这源于现有 CNN 架构中一个有缺陷但常见的设计,即使用跨步卷积和/或池化层,这会导致细粒度信息的丢失和学习效率较低的特征表示 。 为此,我们提出了一种名为 SPD-Conv 的新 CNN 构建块来代替每个跨步卷积层和每个池化层(从而完全消除它们)。 SPD-Conv 由空间到深度 (SPD) 层和非跨步卷积 (Conv) 层组成,可应用于大多数(如果不是全部)CNN 架构。 我们在两个最具代表性的计算机视觉任务下解释这种新设计:目标检测和图像分类。 然后,我们通过将 SPD-Conv 应用于 YOLOv5 和 ResNet 来创建新的 CNN 架构,并根据经验表明,我们的方法显着优于最先进的深度学习模型,特别是在低分辨率图像和小物体的更艰巨的任务上。
官方论文地址:https://arxiv.org/pdf/2208.03641
官方代码地址: