RANet:MSDNet加强版!清华黄高团队提出分辨率自适应的高效推理网络RANet!

关注公众号,发现CV技术之美

本文分享论文『Resolution Adaptive Networks for Efficient Inference』,由清华黄高团队提出分辨率自适应的高效推理网络RANet!MSDNet加强版!


详细信息如下:

3aab7f13b4abaebe0608b7744030bf49.png

  • 论文链接:https://arxiv.org/abs/2003.07326

  • 项目链接:https://github.com/yangle15/RANet-pytorch

导言:

9accdffe609e577a503e0270f53a8a16.png

自适应推理是在深度网络中实现精度和计算成本之间动态权衡的有效机制,现有的工作主要是利用网络深度或宽度上的结构冗余。在本文中,作者关注输入样本的空间冗余,并提出了一种新的分辨率自适应网络(Resolution Adaptive Network,RANet),其灵感来源于低分辨率的表示足以对包含大对象的“简单”输入进行分类,而只有一些“困难”输入样本需要空间上的更详细信息。

在RANet中,输入图像首先被路由到一个轻量级子网络中,该子网络有效地提取低分辨率表示,高预测置信度的样本将提前退出网络,而无需进一步处理,从而降低计算资源。同时,网络中的高分辨率路径用于识别数据集中的“困难”样本。因此,RANet可以有效减少高分辨率输入的空间冗余。通过实验,作者在CIFAR-10、CIFAR-100和ImageNet数据集上证明了RANet的有效性。

      01      

Motivation


尽管计算机硬件的进步使得训练非常深的卷积神经网络(CNN)成为可能,如ResNe和DenseNet,但在许多应用中,深度CNN的高计算成本仍然是无法承受的。目前,很多方法已经被提出用来加速深层模型的推理,比如轻量级网络结构设计、网络剪枝和模型量化等等。其中,自适应推理的方案旨在通过动态调整网络结构或以每个输入为条件的参数来减少“简单”样本上的计算冗余,该方案已被证明具有良好的性能。

现有的自适应推理研究大多集中于减少“简单”图像的网络深度或宽度上。研究表明,不同样本的分类难度差异很大:其中一些样本可以用较少层或通道的小模型进行正确分类,而另一些样本可能需要较大的网络。目前在这一方向上也有很多的研究,比如MSDNet允许一些样本在一定的预测置信度条件下提早退出分类器。

9668fb3504b120e43a9b27af0ab19811.png

在本文中,作者从一个新的角度来考虑自适应推理。现有研究集中于网络结构中的计算冗余,而本文的目标是利用数据样本中的信息冗余。本文的动机是,低分辨率特征表示足以对“简单”样本进行分类(如上图a所示),而包含细节的高分辨率特征对于准确识别某些“困难”样本(如上图b所示)是必要的。


同时,这也符合“coarse to fine processing ”的设计思想。从信号频率的角度,可以使用低分辨率特征中包含的低频信息对“简单”样本进行正确分类。当无法准确预测具有低分辨率特征的样本时,高频信息可以用于识别“困难”样本。

基于上述思想,作者提出了一种解决方案——分辨率自适应网络(Resolution Adaptive Network,RANet),它实现了在深层CNN中执行了分辨率自适应的思想。它由具有不同输入分辨率的子网络组成,“简单”样本通过处理低分辨率特征图的子网络进行分类。当前一个子网未能达到给定标准时,将采用分辨率较高的子网。同时,将前面子网络中的粗粒度特征重新利用并融合到当前子网络中。RANet的自适应机制通过避免在高分辨率特征上执行不必要的卷积,提高计算效率。


      02      

方法


2.1. Adaptive Inference Setting

作者提出了一个自适应推理的模型。作为一个带有K个分类器的网络,这些分类器添加在模型的不同深度。给定一个输入图像x,第k个分类器(,,)的输出可以表示为:

其中θ表示与第k个分类器对应部分网络的参数,每个元素是第c个类的预测置信度。

自适应模型根据样本的复杂性,动态分配适当的计算资源来预测样本。样本将在输出满足特定标准的第一个分类器处退出网络。在本文中,作者使用Softmax输出的最高置信度作为决策依据,阈值为。该过程可以表示为:

阈值用于控制测试时分类精度和计算成本之间的权衡。

2.2. Overall Architecture

5bd6954738c80dbd5d4bdb8937a8c663.png

上图展示了展示了本文方法的框架图,它包含对应于不同分辨率的初始层和子网络,每个子网络在最后几个块上都有多个分类器。与MSDNet类似,作者在本文中采用了多尺度结构(multi-scale architecture)和密集连接(dense connection)。

尽管RANet和MSDNet具有相似的多尺度结构,但它们的结构设计和计算图存在着显著的差异。最显著的区别是RANet需要首先提取低分辨率特征,这与经典深度CNN(包括MSDNet、ResNet、DenseNet等)中提取高分辨率特征的传统设计惯例是不同的。

RANet的基本思想是,网络将首先基于最低空间分辨率的特征,使用第一个子网络预测样本,以避免对高分辨率特征执行卷积导致的高计算成本。如果第一个子网络对样本做出不可靠的预测,则低分辨率的中间特征将融合到具有更高分辨率的下一个子网络中。然后由下一个较高分辨率特征的子网络执行分类任务。重复此过程,直到一个子网络产生可靠的预测,或使用最后一个子网络。

RANet的自适应推理过程如上图所示:使用H个子网络(图中H=3)和输入样本x,网络将首先生成H个S尺度的基本特征图(例如,图中有3个尺度,s=1表示最低分辨率)。与子网络相对应的基本特征可以表示为。

然后,子网络1首先使用最小分辨率的特征执行分类任务。如果子网络1未能以高置信度实现分类结果,则将使用处理较大尺度特征()的子网络2对样本进行进一步分类。子网1中的中间特征会融合到子网2中。如果子网络2未能做出可靠的预测,将对子网络3重复此过程。

上述推理过程符合人类对图像识别的直觉。具有代表性特征的“简单”样本有时可以以高置信度正确分类,即使仅提供低分辨率表示。具有非典型特征的“困难”样本只能基于从高分辨率特征图中提取的具有细节的全局信息进行正确识别。

2.3. Network Details

2.3.1 Initial Layer

初始层用于生成S个尺度的H个基础特征,其垂直布局视为一个微型的“H层”卷积网络(如上图所示)。上图显示了有三个尺度的3个基本特征的RANet。第一个具有最大尺度的基本特征来自于常规卷积,后面低分辨率的特征由在上一个尺度的特征上进行步长>1的卷积获得。这些基本特征的尺度可以相同。例如,一个RANet可以具有3个尺度中的4个基本特征,其中最后两个基本特征的尺度具有相同的分辨率。

2.3.2 Sub-networks with Different Scales

由于初始层生成H个基础特征,因此本文的网络可以分为H个子网络,H个子网络由不同的卷积块组成。

Sub-network 1

1291d33837c87a94c8c9145720f4f374.png

具有输入的子网络1处理最低分辨率的特征。作者选用了l层的Dense Blocks作为子网络1,如上图所示。此外,每个Dense Blocks第i层的输出也会传到子网络2中以重用特征。通常,可以将子网络1视为具有多个分类器的DenseNet,用来处理最低分辨率的特征映射。

Sub-networks on larger-scale features

d32ed10d4842fdcc3de38da29f346fde.png

具有尺度s的子网络h处理基本特征,融合了上一个子网络(h-1)的特征。用于融合特征的卷积模块称为融合模块(如上图所示)。假设子网络(h-1)中有个块,那么子网络h的前个块都是融合模块。

作者设计了两种不同的特征融合方法。一个保持输入分辨率,如上图(b)所示,而另一个通过步长大于1的卷积层减小特征尺度,如上图(c)所示。

为了生成具有更高分辨率的新特征图作为输入,上图(b)中的融合模块首先用常规卷积来生成。上一个子网络中尺度(s-1)的特征通过Up-Conv(即,常规卷积+上采样)进行处理,这确保生成的特征具有相同的空间分辨率。然后,通过密集连接的concatenation融合得到的特征。

上图(c)中,下采样的融合模块使用步长大于1的卷积来减少空间维度,如蓝色虚线箭头所示,然后在池化操作之后执行密集连接的concatenation。由于当前子网中的特征尺度减小,因此前一个子网中的特征由常规卷积处理以保持低分辨率,然后在末端的块中进行融合。

子网络h可以通过以下方式构建:对于一个有个块的子网络,前个块可以看做是融合模块(Fusion Blocks),剩下的模块为常规的密集模块(Dense Blocks)。此外,作者在第个模块中进行了s次下采样,确保在附加分类器的每个子网络的末端,特征具有最低的分辨率。

Transition layer

在网络中,作者实现了过渡层(Transition layer)来进一步压缩每个子网络中的特征映射。过渡层由1×1卷积后面接上BN层和ReLU层实现,过渡层进一步保证了所提出网络的计算效率。

Classifiers and loss function

作者在不同子网络的最后几个块中加上了分类器,在训练阶段,输入样本依次通过不同的子网络,每个分类的损失函数均为交叉熵损失函数,RANet的总体损失函数设置为这些分类器的损失之和,在实验中,作者为每个损失分类器的损失函数赋予了相同的权重。

2.4. Resolution and Depth Adaptation

0088372418c760720ff89300909011bc.png

本文提出的RANet可以同时实现MSDNet中采用的深度自适应和分辨率自适应,上显示了MSDNet(左)和RANet(右)之间的主要区别。在RANet中,具有小尺度输入的Dense Blocks被依次激活,深度自适应在单个尺度内进行。

如果前一个子网络不能进行高置信度的预测,则输入样本将传播到下一个子网络,并重复深度自适应的过程,直到预测置信度满足标准,或达到整个网络的最后一个分类器。这种推理方案自然地结合了分辨率和深度自适应,实现了MSDNet的显著性能提升。


      03      

实验


3.1. Anytime Prediction

86e9034e04b5145386fc8add799bae16.png

在anytime prediction设置中,作者评估自适应网络中的所有分类器,上表展示了相应的 计算量和准确率。可以看出,本文的RANet具有性能和计算量上的优势。

3.2. Budgeted Batch Classification

c61163e54e43a6699f985d616abab65a.png

上表展示了budgeted batch classification设置下,本文方法和其他方法的性能和计算量对比,可以看出,本文方法在性能和计算量上的优越性。

3.3. Visualization and Discussion

作者还可视化了一些“简单样本”和“困难样本”的例子。

Multiple objects

47e0390625858aab597829b84b04d1b2.png

从上图可以看出,图中包含多个目标的样本通常为困难样本。

Tiny objects

5922dce54940dbc3b2de35ee5a82a390.png

从上图可以看出,图中目标较小的样本通常为困难样本。

Objects without representative characteristics

d5f7f734fa9186980d2b0ee0c94dcb8a.png

从上图可以看出,图中的目标没有显著特征的样本通常为困难样本。


      04      

总结

在本文中,作者提出了一种基于多尺度密集连接结构的分辨率自适应神经网络——RANet。RANet首先将处理粗粒度特征的轻量级子网络用于图像分类。具有高预测置信度的样本将提前从网络中退出,具有更精细细节的较大尺度特征将仅进一步用于那些在上一个子网络中没有得到高置信度输出的样本。这种分辨率自适应机制和RANet中各子网的深度自适应保证了其较高的计算效率。在三个图像分类基准数据集上的实验结果证明了RANet的有效性。

▊ 作者简介

研究领域:FightingCV公众号运营者,研究方向为多模态内容理解,专注于解决视觉模态和语言模态相结合的任务,促进Vision-Language模型的实地应用。

知乎/公众号:FightingCV

4a2e71d89d0b99ae89d3188f7157c385.png

END

欢迎加入「超分辨率」交流群👇备注:SR

b036a0c6a5d2740d592487c9581b6f62.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65133.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ICLR2021 | 清华大学黄高团队:显存不够?不妨抛弃端到端训练

智源导读:本文主要介绍清华大学黄高团队被ICLR2021接收的一篇文章:Revisiting Locally Supervised Learning: an Alternative to End-to-End Training。 论文链接:https://openreview.net/forum?idfAbkE6ant2 代码链接:https://g…

清华大学黄高——图像数据的语义层扩增方法

⬆⬆⬆ 点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2020 年 9 月 25 日,在由中国科协主办,清华大学计算机科学与技术系、AI TIME 论道承办的《2020 中国科技峰会系列活动青年科学家沙龙——人工智能学术生态与产业创新》上&#xf…

DenseNet发明者黄高:动态模型好在哪里?

智源导读:自2012年至今,计算机视觉领域蓬勃发展,各种模型不断涌现,短短 8 年时间,计算机视觉领域便发生了天翻地覆的变化。那么如何看待过往变化,当下研究又如何? 12月10日晚,在【青…

对话 DenseNet 一作黄高:做有韧劲、能抗压、不断探索未知的科研

点击上方“计算机视觉工坊”,选择“星标” 干货第一时间送达 作者丨刘冰一 来源丨极市平台 清华大学助理教授、密集连接卷积网络 (DenseNet)提出者 、计算机视觉领域一作顶会论文被引次数最高的国内学者、百万青橙奖奖金获得者..... 这些标签…

测试工程师的好日子来啦?Testin发布AI测试产品,提升易用性和自动化效率

2019年10月26日,以"AI未来"为主题的第二届NCTS中国云测试行业峰会在北京国际会议中心正式开幕。在本次大会上,Testin 总裁徐琨正式发布测试业务Testin云测的全新AI产品iTestin。作为 Testin 人工智能战略中的重要一环,iTestin 融合…

【CodingNoBorder - 07】无际软工队 - 求职岛:ALPHA 阶段测试报告

无际软工队 - 求职岛:ALPHA 阶段测试报告 项目内容这个作业属于哪个课程2022年北航敏捷软件工程这个作业的要求在哪里团队项目-Alpha阶段测试报告我们在这个课程的目标是熟悉敏捷开发的方法论,并通过实际开发产品进行实践。这个作业在哪个具体方面帮助我…

pytest测试报告Allure - 动态生成标题生成功能、添加用例失败截图

一、动态生成标题 默认 allure 报告上的测试用例标题不设置就是用例名称,其可读性不高;当结合 pytest.mark.parametrize 参数化完成数据驱动时,如标题写死,其可读性也不高。 那如果希望标题可以动态的生成,采取的方案…

❀YOLOv5学习❀图像标注工具LabelImg的下载,配置和使用。

LabelImg是图形图像注释工具。它是用Python编写的,并将Qt用于其图形界面。批注以PASCAL VOC格式(ImageNet使用的格式)另存为XML文件。此外,它还支持YOLO格式。下载这个,主要是为了YOLOv5中,做自己的数据集&…

brat事件标注平台使用教程

事件图谱首先涉及到的是事件标注,我采用的是brat事件标注平台,该平台使用的是Linux系统,因为我的电脑是windows系统, 将brat安装在了linux虚拟机(Ubuntu)上。 一.下载与安装 1.下载brat 进入brat官网brat…

OpenAI 成近期顶流团队?如何使用 OpenAI 和 Node.js 构建 AI 图像生成器?

摘要: 12月7号,知名人工智能研究机构 Open AI 在Youtub上发布视频介绍使用OpenAI 和 DALL-E 模型创建一个网络应用程序,该应用程序将根据输入的文本从头开始生成图像。https://www.youtube.com/watch?vfU4o_BKaUZE 前言💖 大家好&#xff0…

AI 自动写代码插件 Copilot(副驾驶员)

AI 自动写代码插件 Copilot 提示:Copilot单词直译过来就是副驾驶员的意思。 介绍:本质上就是基于GitHub开源的亿级别的代码,训练AI模型,自动生成代码。 就是数据量(GitHub的数据量就很大!)能够决定你AI模型精度的上…

软件测试中的AI——运用AI编写测试用例

文章目录 一、现状二、测试技术可结合AI的几个方向三、尝试使用AI编写测试用例(实验过程)1、AI联系上下文的能力弱2、回答的内容类似于能在网上搜索到的内容3、需要有一个明确的指令4、输出内容有限5、无法想象到需求描述之外的内容 四、总结&#xff1a…

AI热度降温?揭秘加德纳技术成熟度曲线与AI发展阶段

一文解决你所有对 AI 的焦虑 近期,我们发现ChatGPT的热度似乎不如前几个月。许多人尝试了这个技术,觉得它非常强大,但似乎与自己的日常生活和工作关系不大,因此逐渐失去了兴趣。 然而,这实际上是技术发展的正常周期&…

王炸赚钱组合!!ChatGPT + AI大模型

“ 你近期有体验过哪些大模型产品呢? 你有使用大模型API做过一些实际开发吗? 在你日常开发中,可以与大模型相关应用结合来完成工作吗? ” 从去年底开始,大模型的发展趋势就非常迅猛,这也代表着人工智能进入…

ChatGPT + AI大模型 = 王炸!!!

“ 你近期有体验过哪些大模型产品呢? 你有使用大模型API做过一些实际开发吗? 在你日常开发中,可以与大模型相关应用结合来完成工作吗? ” 从去年底开始,大模型的发展趋势就非常迅猛,这也代表着人工智能进入…

ChatGPT+低代码,好用到飞起?

ChatGPT 凭借短短 2 个月,月活用户突破 1 亿,成为史上用户增长速度最快的消费级应用程序。ChatGPT 的爆火,在全球范围内掀起了一场关于 AI 技术革命的狂潮,AIGC 也迅速成为科技圈最火赛道。 更有国际咨询机构预测,203…

信用卡兴趣人群洞察报告.pdf

男性用户对信用卡的关注度显著高于女性 信用卡兴趣人群年龄集中在24-40岁,与主流消费人群相吻合。41岁以上人群信用卡关注度明显滑落 深广信用卡关注度最高,占据前四名知州、西安等中西部城市占据前十名中半数名额 信用卡兴趣人群高度集中于iPhone手机,其次分别为三星、魅族…

关于程序员的调查报告

最近Stack Overflow发布一份开发者调查报告,内容涵盖了开发人员最喜欢的技术到工作偏好等等各种问题。下面小编就带大家一起来看一看。 NO.1 最常用的的编程语言: 我们发现Python的使用度今年超过了Java,Python的势头有点猛啊!&am…

c语言进行数据统计分析的研究报告,统计分析报告范文

统计分析报告范文 大家都知道,统计分析的写作是为了制作统计分析文章。在统计部门,统计分析文章则称为统计分析报告。下面是一篇统计分析报告范文,欢迎阅读! 统计分析报告范文 【目录】 一.引言 二.研究目的 三.数据分析 I.对能源生产及构成的…

论文阅读报告

0 2022/6/23-2022/6/25 1. FLAME: Taming Backdoors in Federated Learning 1.1 本文的贡献 我们提出了FLAME,这是一种针对FL中后门攻击的防御框架,能够消除后门而不影响聚合模型的良性性能。与早期的后门防御相反,FLAME适用于一般对手模型…