文献阅读笔记 | ||
简介 | 题目 | R-CNN minus R |
作者 | Karel Lenc Andrea Vedaldi | |
原文链接 | https://arxiv.org/pdf/1506.06981.pdf | |
关键词 | Null | |
研究问题 | proposal generation在基于CNN的探测器中的作用,以确定它是否是一个必要的建模组件。 R-CNN留下的几个有趣的问题: 第一个问题是CNN是否包含足够的几何信息来定位对象,或者后者是否必须由外部机制(如区域建议生成)进行补充。 第二个问题是R-CNN管道是否可以简化 第三个问题是R-CNN是否可以加速。 通过认识到卷积特征可以在不同区域之间共享,而不是重新计算,空间金字塔池(spp)中的速度已经大大加快了。然而,SPP无法生成非常精确的区域。 | |
研究方法 | 通过设计和评估一个检测器来实现这一点,该检测器使用一个小的区域生成方案,每个图像都是常量。结合SPP,这将产生一个优秀的和快速的检测器,不需要用CNN本身以外的算法处理图像。还通过将几个学习步骤集成到一个算法中,以及通过提出一些加速检测的改进,简化了基于CNN的检测器的训练。 Simplifying and streamlining R-CNN: 放弃候选区域:与基于边界检测的cnn相结合 放弃支持向量机采用softmax | |
研究结论 | 尽管在卷积层而不是全连接层中,当前CNN确实包含大量用于精确目标检测的几何信息。这一发现开启了建立完全依赖CNN的最先进的目标探测器的可能性,消除了区域建议生成方案,如选择性搜索,并导致集成、简单和更快的探测器。 | |
创新不足 | 当前的方案可能会错过图像中的小对象。 | |
额外知识 | 性能检测器:基于手工制作的图像表示(如SIFT、HOG和Fisher矢量)和结构化输出回归(从滑动窗口到可变形零件模型)的组合。 GT boxes、放弃候选区域那块没看懂(码住) |