2024年显著性检测部分论文及代码汇总（3）

ICML

Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection

code
Abstacrt：本文探讨了显著性检测中评价指标的尺寸不变性，尤其是当图像中存在多个大小不同的目标时。作者观察到，当前的指标是尺寸敏感的，较大的对象被关注，较小的对象被忽略。针对此，本文提出一种通用方法，分别评估每个显著对象，有效缓解尺寸的不平衡。此外，作者进一步开发了一个针对这一目标的优化框架。

Spider: A Unified Framework for Context-dependent Concept Segmentation

code
Abstacrt：上下文独立与显著性检测相结合。本文提出一个统一的模型Spider，只有一组参数，训练一次。在图像-掩码组提示符驱动的概念过滤器的帮助下，Spider能理解并区分各种强上下文依赖的概念，从而准确地捕捉提示符的意图。
在这里插入图片描述

TCSVT

Learning Adaptive Fusion Bank for Multi-modal Salient Object Detection

code
Abstacrt：针对多模态显著性检测问题，即MSOD，本文提出adaptive fusion bank，专注于解决MSOD的五个主要挑战，即center bias、scale variation、image clutter、low illumination、thermal crossover。为对多模态输入自适应地选择合适的融合方案，引入自适应集成模块，形成自适应融合bank，嵌入到层级中，以充分融合不同的源数据。此外，还设计了一个间接交互引导模块，通过对高层语义信息和底层空间细节的跳跃集成精确检测显著目标。
在这里插入图片描述

TII

MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects

code
Abstacrt：针对目前参数大、计算成本高、推理速度慢等问题，本文提出多尺度交互模块，即MI，采用深度卷积和点卷积分别独立提取并交互融合不同尺度的特征。在此模块基础上，提出轻量级的多尺度交互网络，即MINet，对表面缺陷的工业物件进行实时显著目标检测。
在这里插入图片描述

TMM

Alignment-Free RGBT Salient Object Detection: Semantics-guided Asymmetric Correlation Network and A Unified Benchmark

code
Abstacrt：目前需手动对齐多模态，本文首次在没有手动对齐的情况下训练网络。具体说，提出一个语义引导的非对称关联网络，即SACNet，由两部分组成：1）非对称关联模块，利用语义语义引导注意力建模非对齐显著区域的跨模态相关性；2）关联特征采样模块，根据RGB特征对热力图特征进行采样，进行多模态特征集成。除此之外，作者构建了一个基准数据集，即UVT2000，该数据集包含直接从各种真实场景中获取的2000对RGB和热图像对，无手动对齐，以促进无对齐RGB-T SOD的研究。
在这里插入图片描述