卷积神经网络(CNNs)通过提取空间特征并在基于视觉的任务中实现了最先进的准确性,彻底改变了图像分类。所提出的压缩激励网络模块收集输入的通道表示。多层感知机(MLP)从数据中学习全局表示,在大多数用于学习图像提取特征的图像分类模型中起到关键作用。在本文中,我们引入了一种新颖的汇聚多层感知机,即多分支密集层,融入了设计用于超越现有架构的压缩激励残差模块。我们的方法结合了压缩激励网络模块和密集层,通过增强网络对通道模式的捕捉和对全局知识的理解,实现了更好的特征表示。与SENet相比,所提出的模型在参数上几乎没有增加。我们在基准数据集上进行了大量实验,验证了该模型,并将其与已建立的架构进行比较。实验结果表明,所提出的模型在分类准确性上取得了显著的提高。
论文地址:https://arxiv.org/pdf/2311.10807.pdf
代码地址:https://github.com/github-eliviate/SENetV2_torch_tf/blob/main/SaELayer_torch.py
文章贡献
- 我们承认聚合模块和Inception架构以及压缩激励模块所传承的强大表征能力对我们的影响是显著的。聚