显著性检测综述(完整整理)

 转载请附链接,注明出处。

显著性对象检测综述

参考:http://mmcheng.net/zh/paperreading/

一、    程明明等人的论文:Salient Object Detection: A Surve(简单归纳了文章中的我认为比较重要的部分)

该论文旨在全面回顾突出显示目标检测的最新进展,并将其与其他密切相关领域(如通用场景分割,目标建议生成以及固定预测的显著性)相关联。主要内容涉及i)根源,关键概念和任务,ii)核心技术和主要建模趋势,以及iii)显著性物体检测中的数据集和评估指标。讨论并提出了未来的研究反向等开放性问题。

1.介绍

1.1 什么是显著性物体

提到一般认为,良好的显著性检测模型应至少满足以下三个标准:1)良好的检测:丢失实际显著区域的可能性以及将背景错误地标记为显著区域应该是低的;2)高分辨率:显著图应该具有高分辨率或全分辨率以准确定位突出物体并保留原始图像信息;3)计算效率:作为其他复杂过程的前端,这些模型应该快速检测显著区域。

1.3显著物体检测历史

(1)Itti等人提出的最早、经典的的显著模型。例如[24]一文掀起了跨认知心理学、神经科学和计算机视觉等多个学科的第一波热潮。

(2)第二波热潮由刘等人的[25],[55]和Achanta等人的[56]掀起,他们将显著性检测定义为二元分割问题,自此出现了大量的显著性检测模型。

(3)最近出现了第三波热潮,卷积神经网络(CNN)[69],特别是引入完全卷积神经网络[70]。与基于对比线索的大多数经典方法不同[1],基于CNN的方法消除了对手工特征的需求减轻了对中心偏见知识的依赖,因此被许多科研人员所采用。基于CNN的模型通常包含数十万个可调参数和具有可变感受野大小的神经元。神经元具有较大的接受范围提供全局信息,可以帮助更好地识别图像中最显著的区域。CNN所能实现前所未有的性能使其逐渐成为显著性物体检测的主流方向。

2. 现状调查

本节主要回顾三部分内容:1)显著性物体检测模型;2)应用;3)数据集。

2.1 经典模型(非常详细)

2.1.1 具有内在线索的基于块的模型

有两个缺点:1)高对比度边缘通常突出而不是突出物体;2)凸显物体的边界不能很好地保存。为了克服这些问题,一些方法提出基于区域来计算显著性。两个主要优点:1)区域的数量远少于区块的数量,这意味着开发高效和快速算法的潜力;2)更多的信息功能可以从区域中提取,领先以更好的表现。

2.1.2 具有内在线索的基于区域的模型(图4)

基于区域的显著性模型的主要优势:1)采用互补先验,以提高整体性能,这是主要优势;2)与像素和色块相比,区域提供更复杂的线索(如颜色直方图),以更好地捕捉场景的显著对象;3)由于图像中的区域数量远小于像素数量,因此在生成全分辨率显著图时,区域级别的计算显著性可以显著降低计算成本。

2.1.3 具有外部线索的模型(图5)

2.1.4 其他经典模型(图6)

局部化模型、分割模型、监督模式与无监督模式、聚合和优化模型

2.2 基于深度学习的模型

2.2.1 基于CNN(经典卷积网络)的模型

CNN大大降低了计算成本,多级特征允许CNN更好地定位检测到显著区域的边界,即使存在阴影或反射。但CNN特征的空间信息因为使用了MLP(多层感知器)而无法保留。

2.2.2 基于FCN(完全卷积网络)的模型

该模型具有保存空间信息的能力,可实现点对点学习和端到端训练策略,与CNN相比大大降低了时间成本。但在具有透明物体的场景、前景和背景之间的相同对比度以及复杂的背景等情况无法检测显著物体。

元素: PI=像素,PA=补丁,PE=区域,前缀m和h分别表示多尺度和分层版本。

假设: CP=中心先验,G=全局对比度,L=局部对比度,ED=边缘密度,B=背景先验,F=先验焦点,O=先验物体,CV=先验凸度,CS=中心环绕对比度,CLP=先验颜色,SD空间分布,BC=边界连通之前,SPS=稀疏噪声。

聚合/优化: LN=线性,NL=非线性,AD=自适应,RI=分层,BA=贝叶斯,GMRF=高斯MRF,EM=能量最小化,LS=最小二乘解

线索 :GT=地面真值注释,SI=相似图像,TC=时间线索,SCO=显著性实现,DP=深度,LF=光场。

对于显著性假设 : P=通用属性,PRA=预注意线索,HD=高维特征空间中的判别性,SS=显著性相似性,CMP=显著性提示的互补,SP=采样概率,MCO=运动相干性,RP=重复性,RS=区域相似度,C=相应,DK=领域知识。

其他 : CRF=条件随机场,SVM=支持向量机,BDT=提升决策树,RF=随机森林

4 数据集和评估措施

4.1 显著对象检测数据集

早期的带有包围框的突出物体图像:MSRA-A和MSRA-B

使用像素方式的二进制掩码来注释显著对象:ASD和DUT-OMRON

具有复杂和杂乱背景中的多个对象的数据集:[22]、[23]、[26]

4.2 评估措施(5个)

用S表示归一化为[0,255]的预测显著图,G是显著对象的地面正式二进制掩模

(1) 精确召回(PR)。首先将显著图S转化为二进制掩码M,然后通过将M与地面真值G进行比较来计算Precission和Recall:

(2) F值:通常Precission和Recall都不能完全评估显著图的质量,为此提出F值作为Precission和Recall的非负权重的集权跳河平均:

(3) ROC(Receiver Operating Characteristic)曲线:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线

(4)ROC曲线下面积(AUC):AUC越大性能越好

(5) 平均绝对误差(MAE):进行更全面的比较。

图12,比较流行的显著性对象检测数据集:

 

 

 

二、    传统显著性检测内容补充(论文中的分类和自己平时习惯不一致,所以重新收集资料整理了一下)

常用显著性检测方法:

1.  认知模型

几乎所有模型都直接或间接地受认知模型启发而来,其一大特点是与心理学和神经学相结合。Itti模型(使用三个特征通道:颜色、属性、方向)是这一类模型的代表,也是后来很多衍生模型的基础

2.  信息论模型

本质是最大化来自所处视觉环境的信息,其中最有影响力的模型是AIM模型。

3.  图论模型

基于图轮的显著性模型把眼动数据看成时间序列,使用了隐马尔科夫模型、动态贝叶斯网和条件随机场等方法。图模型可以对复杂的注意机制建模,因此能取得较好的预测能力,缺点在于模型的高复杂度,尤其涉及训练和可读性时。典型模型有:GBVS等

4.  频域模型

基于频谱分析的显著性模型,形式简洁,易于解释和实现,并且在注意焦点预测和显著区域检测方面取得了很大的成功,但其生物合理性不是非常清楚。经典模型有:频谱残差的显著性检测模型(纯数学计算方法)。

 

参考资料链接:

http://www.docin.com/p-915060851.html

http://www.doc88.com/p-4993561181219.html

http://blog.csdn.net/u012507022/article/details/52863461

 

 

 

三、    基于深度学习的显著性检测内容补充(论文是2014年所写,关于深度学习部分不够完善,因此在此又补充了一下)

基于深度学习的显著性目标检测研究发展初期从物体检测神经网络到OverFeat,一直难以取得理想的效果。2014R-CNN的诞生成为第一个真正可以工业级应用的方案,其在VOC2007测试集的mAP提升至66%。但R-CNN框架仍然存在很多问题:

1) 训练分为多个阶段,步骤较为繁琐:微调网络+训练SVM+训练边框回归器

2) 训练耗时,占用磁盘空间大:5000张图片产生几百G的特征文件

3) 速度慢:使用GPUVGG-16模型处理一张图像需要47s

截止目前,基于深度学习的显著性目标检测研究可以分为基于区域建议的深度学习目标检测基于回归的深度学习目标检测两个类别。

 

基于区域建议的深度学习目标检测方法有:R-CNNSPP-netFastR-CNNFaster R-CNNR-FCN等。

1) R-CNN(Regions with CNN features)重复计算,时间、空间代价较高;

2) SPP-net(Spatial Pyramid Pooling)强化了CNN的使用,允许输入大小不一致的图片,进一步强调了CNN特征计算前移、区域处理后移的思想,极大节省计算量,但不是端到端的模型且CNN特征提取没有联动调参数;

3) FastR-CNN的出现解决了前两者重复计算的问题,实现了区域建议到目标检测一端的卷积共享,首次提出的RoI Pooling技术极大地发挥区域后移的优势,加快了训练速度,采用VGG-16作为CNN网络模型,联动调用参数提升了实验效果,但是依然没有实现端到端的模型,对SS区域建议依赖严重;

4) Faster R-CNN弃用选择性搜索,提出了RPN网络来计算候选框,使用端到端的网络进行目标检测,无论在速度上还是在精度上,都得到了极大的提高,但在速度上并不能满足实时的需求,对每个建议分类计算量仍较大,功能上没有进入实例分割阶段。

 

基于回归的深度学习目标检测方法有:YOLOSSDG-CNNNMS等。

1) YOLO(You Only Look Once)将目标检测任务转换成回归问题,大大简化了检测的过程、加快了检测的速度,但预测目标窗口时使用的是全局信息,冗余度高,且没有区域建议机制后检测精度不高;

2) SSDSingle ShotMultibox Detector)预测某个位置时使用的是该位置周围的特征,结合YOLO的回归思想以及FasterR-CNN中的候选区域机制,既保持了YOLO速度快的特性,也保证了精确定位;

3) G-CNN着力于减少初始化建议数量,使数以万计的建议变成极少的初始格网,提升了检测速度;

4) NMS(Non Maximum Suppression)则通过迭代的形式去除重复候选框,取置信率最大的框。

当前实际应用中,基于区域建议的深度学习目标检测使用更为广泛。

 

当前基于深度学习的显著性检测研究方法:

R-CNN系列显著性目标检测框架和YOLO显著性目标检测框架给了我们进行基于深度学习的目标检测两个基本框架。目前研究人员基于这些框架从其他方面入手提出一系列提高目标检测性能的方法。如:难样本挖掘、多层特征融合、使用上下文信息、更深网络学习的特征等。

 (本来是熬了个夜准备组会的稿子~结果最后也没汇报成,有种换好衣服结果告诉我不用出门了,小失落~)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/72398.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

显著性检测数据集—学习笔记

文章目录 DUT-OMRONDUTSHKU-ISECSSD/CSSDSODPASCAL-S参考资料 DUT-OMRON 数据集包含5168张图像,最大边长为400像素,数据集中具有一个或多个显著对象和相对复杂的背景,具有眼睛固定、边界框和像素方面的大规模真实标注的数据集。 论文: C. Ya…

【计算机网络】计算机网络基础知识总结(秋招篇)

文章目录 前言计算机网络笔记TCP和UDP分别是什么 有什么区别基于TCP UDP这两个协议的上层协议有哪些?TCP和UDP分别在哪些领域被用的多?TCP实现可靠性传输用了哪些技术?(TCP如何实现可靠性传输)讲一下超时重传和超时定时…

汤家凤高等数学基础手写笔记-导数与微分

越来越发现,下层基础决定上层建筑。除了考试,在研究中,我们能够用到的就是理论体系的知识,而不是会做题目的多少。做题目的目的在于加深对基础理论的理解。 本系列笔记汇总之处:汤家凤高等数学基础课2020年基础笔记概…

请教高数题

这里这么多学霸,教我一道不定积分的计算,应该不难吧

【高数】高数竞赛必背重点(随时更)

高数竞赛必背重点(随时更) 博主高数相关文章链接 左边为必背知识点,右边为备注栏 博主高数相关文章链接 高数第一章节——极限&无穷&连续与间断 高数第二章节——导数&求导法则&高阶导数&微分 高数第三章节——微分中值…

高数做题小技巧:分布积分的计算法—表格法

考研数学3分钟秒杀分布积分的计算法—表格法的拓展理解---bilibili

高等数学辅导讲义_历年真题,复习讲义的经验分享(数二127分)

纯属个人经验 之前的回答里面提到了我使用的教材 2021 考研数学该怎么复习?​www.zhihu.com 其实我刚开始备考的时候,也跟很多人一样,盲目的买了很多教材,又买了很多练习册,刚开始备考的时候看着一大摞书,心里就开始飘了,想着做完这些拿高分还不是轻轻松松 然而现实很残…

高数————思维导图(上岸必备)(积分部分)

高数————思维导图(上岸必备)(极限与连续). 高数————思维导图(上岸必备)(微分部分). 高数————思维导图(上岸必备)(积分部分). 高数————思维导图(上岸必备)(级数部…

2022张宇考研基础30讲 第八讲 一元函数积分学的概念与计算

文章目录 第八讲 一元函数积分学的概念与计算不定积分原函数(不定积分)存在定理用导数介值定理解释 定积分变限积分不定积分与变限积分的比较 积分的奇偶性积分的周期性反常积分基本积分公式基本积分方法凑微分法换元法分部积分法: 有理函数的…

2022mathorcupD题思路交流

今年Mathorcup难度整体难度比较大,四道题对算法编程能力要求都较高,计算量都比较大。作为新手的话建议可以优先考虑A和D题,整体对新手稍微友好一些。这里给出D题我的思路,仅供大家参考。移动通信网络站址规划和区域聚类问题&#…

高等数学辅导讲义严选题辅导讲义(学习笔记)

第一章 函数 极限 连续(选择题部分): 问题描述 问题分析: 思路:判断ABC三个选项比较复杂,D选项易于判断 解决方法: 问题描述 问题分析: 定理:若f(x&#xff0…

【考研笔记】数学一 · 高等数学笔记

考研一战顺利上岸啦,报考专业计算机科学与技术,考的数一英一。现在离开学还有段时间,所以趁机把自己的笔记都整理一下,希望可以帮到一些备考的同学。 写在前面: 首先说一下自己的复习计划跟想法。数一今年有点难&am…

全国大学生数学竞赛备考——高数上(极限、导数、微分、积分、级数)

我真的会忘(3) 极限两个重要极限公式常用极限公式 导数、微分与积分牛顿-莱布尼茨公式莱布尼兹公式微分中值定理罗马中值定理拉格朗日中值定理柯西定理 泰勒公式几个常见的麦克劳林公式 洛必达曲率曲率圆牛顿迭代法积分中值定理分部积分法 级数正项级数审…

考研数学刷题知能行怎么样?

被考研数学折磨的小伙伴看过来! 恭喜你,捡到宝了!本人22考研数二选手,人在宿舍,刚下考场。本人从高中开始数学就一直很拉胯,学数学对我来说真的是太折磨了QAQ 从1月份开始准备考研数学,一开始真…

知能行考研数学的高数部分怎么样?大一可以用吗?

目录 方法一等价替换 方法二泰勒公式 方法三洛必达法则 一、值得一看的网课 二、带着问题听课 三、如何调整在学习高数时的心态 四、总结 我上大学的时候,面对这两部分知识点,也学得很吃力,尤其是微积分 但是后来我学明白之后&#x…

迭代后首波实测!360智脑一键联网,代码超强,AI诈骗一眼看穿

360大模型(又)交卷了!作为国内首个能联网的大模型,360智脑给了我们怎样的惊喜?话不多说,新鲜出炉的第一手实测来了。 不得不说,自从GPT大模型混战开赛之后,教主周鸿祎可谓是存在感十…

AI公司CEO冒充中科大少年班校友!清华、斯坦福名校经历全造假

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 转自:3D实验室 | 来源:中国科大新创校友基金会 打假 中国科学技术大学新创校友基金会与中国科学技术大学少年班校友会(以下分别简称“中国科大新创校友…

斯坦福前校长John Hennessy、张亚勤等一众大佬云集,共探最前沿技术 | CNCC2020

金磊 发自 凹非寺量子位 报道 | 公众号 QbitAI 基础软件、尖端技术,频频被「卡脖子」,当下时局该如何突围? 这或许就是当下技术从业者,最为关心的一个问题。 由中国计算机学会 (CCF)举办的中国计算机大会 &…

ChatGPT - 使用28原则快速学习的Prompt

文章目录 Prompt例子 Prompt “我想了解[你想了解的主题]。识别并分享该主题中最重要的20%的学习内容,这将帮助我理解80%的内容。”例子