NeurIPS 2020 | 基于协同集成与分发的协同显著性目标检测网络

论文题目:CoADNet: Collaborative Aggregation-and-Distribution Networks for Co-Salient Object Detection

论文链接:https://proceedings.neurips.cc/paper/2020/file/4dc3ed26a29c9c3df3ec373524377a5b-Paper.pdf

论文代码:https://github.com/rmcong/CoADNet_NeurIPS20

讲解视频(机器之心NeurIPS‘20 MeetUp@北京):https://www.bilibili.com/video/BV1np4y1z7B7


1 引言

受人类的协同处理机制启发,协同显著性目标检测(CoSOD)任务旨在确定一个图像组数据中反复出现的共有显著性目标。因此,除了判定目标的显著与否以外,如何有效捕获图间关系是CoSOD任务的关键。上图中给出了一个示例,其中只有柠檬是在三幅图像中多次出现的显著性目标,而其他目标需被抑制,最后一列黄色底纹的结果是本文方法得到的,可以看出其可以完整、有效地突出协同显著性目标,并有力抑制杂乱背景的干扰。

目前基于深度学习的协同显著性目标检测研究尚处于起步发展阶段,具有以下三方面问题:

(1)RGB协同显著性检测是在图像组中进行检测,学习到的群组语义会随输入图像组的顺序不同而变化,从而导致训练不稳定;

(2)图内显著性和图间关系存在竞争,学习到的群组语义直接与个体特征融合会导致图像间交互过程中的信息冗余;

(3)特征解码时忽略了图像间的一致性,这导致最终的协同显著性检测结果的图间一致性降低。

基于此,本文提出了一种基于协同集成与分发的协同显著性目标检测算法,网络在公开数据集上获得了更加准确、一致性更好的检测结果,具体贡献包括:

(1)设计了一个在线图内显著性引导(OIaSG)模块,用于提供显著性先验知识,该模块以联合优化的方式提供可训练的显著性指导信息;

(2)提出了一个两阶段的集成和分布架构,以学习群组对应关系和协同显著性特征,主要包括群组注意语义集成(GASA)模块和门控群组分发(GGD)模块。

(3)构建了群组一致性保持解码器(GCPD),更加充分地利用图像间约束在生成全分辨率协同显著性图的同时保持群组一致性。

2 方法

本文方法是一种端到端的结构,在给定图像组的情况下,首先使用共享的骨干特征提取器来获取深层特征,并通过在线的图内显著性引导模块生成图内显著性特征,然后将群组注意力语义集成模块和门控群组分发模块集成到一个两阶段的集成-分发结构中来聚合群组语义特征并自适应地将其分配给不同的个体,以实现协同显著性特征学习。最后,将低分辨率的协同显著性特征送入群组一致性保持解码器和协同显著头部件中来一致性地突出协同显著性目标并生成全分辨率的协同显著性图。

在线图内显著性指导(OIaSG)模块:从概念上讲,协同显著性检测任务可以分解为两个关键部分,即显著性和重复性。前者要求目标在视觉上是显著的、容易引起注意的,而后者则约束目标在图像组中是重复多次出现的。但是,此任务面临的挑战是:1)单个图像中的显著性目标可能不会在其他图像中都出现,2)重复的对象不一定在视觉上是显著的,这使得很难学习到将这两个因素结合在一起的统一表示。因此,采用联合学习框架来提供可训练的显著性先验作为指导信息,以此抑制背景冗余。

得益于图内显著性分支的联合优化框架,协同显著性分支可以得到可信度更高、更为灵活的引导信息。在训练阶段,除了从协同显著性目标检测数据集加载的输入外,还将从单图显著性目标数据集加载的K个辅助样本与图内显著性头部件同时馈送到共享的骨干网络,从而生成单图显著性图,单图显著性和协同显著性预测作为一个多任务学习框架进行联合优化,在提供可靠的显著性先验方面具有更好的灵活性和可扩展性。

群组注意语义集成(GASA)模块:为了有效地捕获具有判别力、鲁棒的组间关系,设置了三个关键标准:1)对输入顺序不敏感,这意味着所学习的群组语义特征应对分组图像的输入顺序不敏感;2)考虑到协同显著性目标可能位于图像中的不同位置,因此需要对空间位置变化鲁棒;3)兼顾计算效率,特别是在处理大型图像组或高维特征时。基于此,提出了一种计算效率高且对顺序不敏感的群组注意力语义集成模块,该模块能够很好的在组语义上下文中建立协同显著对象的局部和全局联系。

直接串联图内显著性特征来学习群组关系不可避免地会导致较高的计算复杂度和顺序敏感性,通过将通道分组调整为按块分组来设计特征重组策略,该重组策略在块级别重新组合了特征通道。此外,为了获取更丰富的语义信息,将每个块级群组特征   独立处理,然后融合得到群组语义表示。由于   只集成了相同位置的图间特征,因此进一步聚合了不同空间位置之间的图间关系。现有的群组集成方法只对局部对应关系进行建模,不能很好地对分散的协同显著性目标的远程依赖关系进行建模,因此本文将局部和全局关系编码为群组注意力结构。首先利用具有不同半径的空洞卷积来整合多感受野特征并捕捉局部上下文信息。然后基于注意力的方式对长距离语义依赖关系进行了建模。

门控群组分发(GGD)模块:在以往的研究中,学习到的群组语义信息被直接复制,然后与图内显著性特征连接,这意味着分组信息被不同的图像平等地利用。实际上,群组语义编码了所有图像之间的关系,对于不同图像的协同显著性预测来说,这可能包括一些信息冗余。因此,本文提出了一种门控群组分发模块来自适应地将最有用的组间信息分配给每个个体,构造了一个动态学习权重的群组重要性估计器,通过门控机制将群组语义与不同的图内显著性特征结合起来。

群组一致性保持解码器(GCPD):分层特征提取产生低分辨率的深度特征,这些特征应该被放大以生成全分辨率预测。然而,最常见的基于上采样或反卷积的特征解码器不适用于协同显著性目标检测任务,因为它们忽略了图像间的约束关系,并且在预测过程中可能会削弱图像之间的一致性。因此,本文提出了一种组间一致性保持解码器来一致地预测全分辨率协同显著性图。该部分包含了三个级联的特征解码(FD)单元,在每个单元中,生成紧凑的组特征向量   。通过堆叠三个级联特征解码单元,可以获得空间分辨率最精细的   个解码特征,并进一步馈送到共享的协同显著性头部件以生成全分辨率的图。

损失函数:在一个多任务学习框架中联合优化了协同显著性预测和单图显著性预测。给定   个协同显著性图和真图,以及   个辅助显著性预测和真图,通过两个二值交叉熵损失函数来构成整个协同显著性目标检测网络的联合目标函数   。

3 实验

本文在COCO-SEG数据集上进行网络训练,并在CoSOD3k、Cosal2015、MSRC和 iCoseg数据集上进行测试,通过PR曲线、F值、MAE值和S值进行定量评测。

从可视化结果可以看出,本文方法能够完整、准确的提取协同显著性目标,而且能够很好的抑制干扰,如第一组图像中的苹果,它是单图显著性目标但却不是协同显著性目标,本文方法可以较好的进行抑制。

从定量指标上看,本文提供了三种不同骨架网络(即VGG16、ResNet50、DilatedResNet-50)下检测结果,相比于最新的对比算法,本文模型达到了最佳性能。

从消融实验结果中可以看出,本文设计的各个模块都对性能增益起到了正面作用,也证明了模型设计的有效性。

现有的基于深度学习的协同显著性检测方法大都利用样本数量较多的COCO-SEG数据集进行训练,但是COCO-SEG数据集中很多数据并不存在明显的显著性特性,因此直接利用该数据集进行协同显著性模型训练尚有不妥。因此,本文也在呼吁采用更加合适的数据集来进行CoSOD任务的训练。

4 总结

本文提出了一种端到端的协同显著性检测网络,重点考虑了协同显著性检测任务中图间关系建模、图内显著性与图间关系的协同、协同显著性目标的一致性保持等问题,所提模型在多个数据集上都取得了较好的检测效果。

本期编辑:丛润民、张琦坚

责任编辑:张禹墨、杨   宁

      

下载:CVPR /  ECCV 2020开源代码

后台回复:CVPR2020,即可下载CVPR 2020代码开源的论文合集

后台回复:ECCV2020,即可下载ECCV 2020代码开源的论文合集

重磅!CVer-论文写作与投稿交流群成立

扫码添加CVer助手,可申请加入CVer-论文写作与投稿 微信交流群,目前已满2400+人,旨在交流顶会(CVPR/ICCV/ECCV/NIPS/ICML/ICLR/AAAI等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI、中文核心等写作与投稿事宜。

同时也可申请加入CVer大群和细分方向技术群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注:研究方向+地点+学校/公司+昵称(如论文写作+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加微信群

▲长按关注CVer公众号

整理不易,请给CVer点赞和在看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/73069.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

别再对 Istio 一脸懵了,万众期待的第一本 Istio 著作现!已!上!市

过去一年里,Service Mesh作为新兴的微服务架构,在国内大热。其被誉为是下一代微服务,是云原生技术栈的关键组件之一。而Istio作为第2代Service Mesh的头牌, 在 GitHub 上疯狂收获近 15000 颗星,成为 2018 年最热门的项…

每周送新书:Android软件安全、深入浅出Istio、软件架构设计

每周送新书:Android软件安全、深入浅出Istio、软件架构设计 本栏目每周会给大家推荐三个不同领域的新书,每周关注,总有适合你的好书。 每周送新书活动规则: 在文末评论里回复你对本周推荐图书或相关技术的看法,再或者…

(附源码)基于spring boot 青少年公共卫生教育平台的设计与实现 毕业设计 643214

Springboot青少年公共卫生教育平台 摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对青少年公…

IT服务管理的指挥与智慧

IT服务管理的指挥与智慧 在当今动荡不宁、不断变化的 IT 环境中,IT服务管理(ITSM)的重要性不言而喻,它通过保证关键业务系统和服务的可用性和可靠性,为整个企业提供至关重要的支持。随着技术变得越来越复杂&#xff0c…

php比特教务选排课系统的设计与实现毕业设计源码301826

比特教务选排课系统的设计与实现 摘 要 随着人类向信息社会的不断迈进,风起云涌的信息时代正掀起一次新的革命,同时计算机网络技术高速发展,网络管理运用也变得越来越广泛。因此,建立一个B/S结构的比特教务选排课系统来管理选课信…

Springboot爱护大自然的设计与实现 毕业设计-附源码231643

爱护大自然 摘 要 热爱大自然,保护自然环境,是人们处理与自然关系过程中应当遵守的基本行为准则。第一,热爱大自然,是人类社会赖以生存和发展的物质条件。自然界一切对人类社会生活有益的存在物,如山川草木、飞禽走兽、…

python面向对象案例步骤分析_Python面向对象之继承原理与用法案例分析

本文实例讲述了Python面向对象之继承原理与用法。分享给大家供大家参考,具体如下: 目标 单继承 多继承 面向对象三大特性 封装 根据 职责 将 属性 和 方法 封装 到一个抽象的 类 中 继承 实现代码的重用,相同的代码不需要重复的编写 多态 不同…

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录

中国多媒体与网络教学学报杂志中国多媒体与网络教学学报杂志社中国多媒体与网络教学学报编辑部2022年第6期目录 实践研究_案例精选 找春天 左文慧; 1-515 长方体和正方体的认识 史颂; 6-912 测定空气中氧气的含量 彭洪;肖启友; 10-12 基于单元要素 设计智趣活动…

ServiceComb WorkShop 回顾与干货

ServiceComb开源项目 在 北京国家会议中心 LC3(LinuxCon ContainerCon CloudOpen) 大会上如期首发,展台火热,WorkShop交流氛围活跃,被迫延长30分钟结束,那么让我们在这个高规格大会尾声之际好好回顾一把。…

【合集】SAP 成都研究院开发工程师们精彩纷呈的工作和生活片段

SAP 再次荣获卓越职场颁发的「2020年大中华区最佳职场」奖项,也因为连续五年跻身这一榜单,SAP 由此摘取了「最佳职场」皇冠上的宝石 —— 获得了「传奇企业」称号,成为在大中华区首批获此殊荣的公司之一。 作为在 SAP 研究院这个传奇企业内工…

基于MATLAB的静态手势分割与识别研究

一、课题介绍 本课题设计了手势的分割与识别程序系统,结合 MATLAB软件对采集的目标图像进行识别。结合基于运动的手势分割与基于肤色的手势分割2种手势分 割方法,提取运动肤色区域,通过计算此区域的均值与方差矩阵更新高斯模型,设…

篮球 / 欧锦标赛最亮眼的三位球星

本季的欧洲杯篮球比赛成为另类的NBA较劲的场合,昨天字母哥、东契奇、约基奇都有不错的表现,其中字母哥的表现最为出色,希腊队战乌克兰时他单场豪取41分,帮助希腊以99-79击败乌克兰。 本次篮球欧洲杯字母哥莫过于视最闪亮之一&…

《钱进球场》:球场争锋·棒球1号位

动画《钱进球场》改编自森高夕次原作、足立刑事著同名体育漫画,于2017年3月宣布动画化 ,由STUDIO DEEN负责动画制作,于2018年4月6日起播出。动画第二期于2018年10月5日开始播出。全24话。 中文名 钱进球场 原版名称 グラゼニ 动画制作 Stud…

足坛十大最牛裁判:打边裁枪杀球员 红牌逐鹦鹉

足球场上,裁判的权力至高无上,可有些时候,这些黑衣法官展示权威的方式就不太可取了,更有甚者,他们的某些做法竟让人啼笑皆非。接下来,网易体育将会为广大球迷评选出10大最牛裁判。>>>>最强裁判…

迪赛智慧数——其他图表(平行坐标图):世界杯历史个人进球排名TOP10

效果图 2022年卡塔尔世界杯,全世界球迷翘首企盼,据悉,一共有67372名球迷入场观赛,为自己支持的球队鼓噪呐喊,释放蓄势积攒已久的激情。毕竟这一别,距离上届杯赛,已足四年!通过以上图…

[dhtmlxGantt(甘特图)开发手册]第三篇——语言设置、导出PDF/PNG、导出Excel/iCal等

1.简介 第一篇 第二篇 第三篇 第四篇 本文将介绍如何设置 dhtmlxGantt 的语言、导出PDF/PNG、导出Excel/iCal等等。 2.设置语言 顾名思义,语言设置可以让甘特图使用你希望的语言来呈现。 启用语言设置 ———————————————————————————…

GJB438B/438C如何制定软件开发计划

软件开发策划是软件工程化的重要环节,是对软件开发过程和软件开发方法的整体安排,充分完备的软件开发策划是软件产品成功的基础和保证。而如果对项目阶段、周期、人员安排、风险评估等策划的不充分,则后期会给软件产品带来灾难性后果。下面我…

公司私域流量微信运营SOP工作管理甘特图计划表

文档网盘下载地址https://pan.baidu.com/s/1WJ5XnWCfarPYe8xagY88Cw?pwdw56h 可以说只要你长期处于很主动的状态,哪怕你暂时还没有成功,未来的成功就是水到渠成的。而如果长期处于一种被动的状态,哪怕你暂时还没有失败,未来的失…

软件协会第01次活动第01次任务布置:typora文档编写markdown语法

了解更多关注软协官网:https://www.csuftsap.cn/ 来自软件协会编辑,注册会员即可获取全部开源.md资源,请勿转载,归软件协会所有。 文章目录 :star: 软件协会第01次活动第01次任务布置1.标题级别2.纯文本形式粘贴3.划线3.1 上划线…

Android 获取联系人手机号码、姓名、地址、公司、邮箱、生日

public void testGetAllContact() throws Throwable{//获取联系人信息的UriUri uri ContactsContract.Contacts.CONTENT_URI;//获取ContentResolverContentResolver contentResolver ContactListActivity.this.getContentResolver();//查询数据,返回CursorCursor …