目标检测20年(三)

对这篇论文感兴趣的小伙伴可以订阅笔者《目标检测》专栏,关注笔者对该文献的阅读和理解。

前两篇解读链接:

目标检测20年(一)-CSDN博客

目标检测20年(二)-CSDN博客


目录

四、 检测器的加速发展

4.1 特征映射共享计算

4.2 级联检测

4.3 网络修剪和量化

4.4 轻量化网络设计

4.4.1 分解卷积

4.4.2 组卷积

4.4.3 深度可分离卷积

  4.4.4 瓶颈设计

4.4.5 NAS检测

4.5 数值加速

4.5.1 积分图像加速

4.5.2 频域加速

4.5.3 矢量量化


四、 检测器的加速发展

让检测器变得更快一直是一项具有挑战性的工作。加速技术可以分为“检测流水线”加速、“检测骨干(backbone)”加速和“数值计算”加速三个层次,如下图所示:

加速技术从下至上形成金字塔结构:数值计算包括积分图像、快速傅里叶变换(Fast Fourier Transform)、矢量量化和约阶近似。检测引擎/骨干的加速包括网络修剪和量化以及轻量化网络设计。最后,流水线加速包括特征映射共享计算和级联检测。

下面对这些技术分别进行介绍:

4.1 特征映射共享计算

检测器不同计算阶段中,特征提取占据计算量的主导地位。减少特征计算冗余最常用的方法就是只计算一次整幅图像的特征映射,该方法已实现数十倍甚至百倍的加速。

4.2 级联检测

级联检测是一种常用技术,采用从“粗”到“精”的检测理念,使用简单计算过滤简单的背景窗口,用复杂窗口处理困难窗口。该方法适用于大场景小物体检测任务,如人脸、行人的检测。

4.3 网络修剪和量化

“网络修剪”和“网络量化”是两种加速CNN模型的方法。前者修剪网络结构或权值,后者减少代码长度。最初网络修剪采用迭代训练和修剪,每个训练阶段后只去除一小组不重要的权值并重复该操作。目前的工作集中于网络二值化,通过激活或权重量化为二进制(0/1)压缩网络,将浮点运算转为逻辑运算。

标准的卷积如下图所示:

4.4 轻量化网络设计

除了有“少通道多层”的方法外,近年来也提出了许多其他方法。

4.4.1 分解卷积

这是轻量级CNN最直接的方法。一般有两组分解方法:第一组是将大的卷积滤波器分解成一组小的,如下图所示:

我们可以将一个7×7的滤波器分解成三个3×3的滤波器,并且它们享受相同的感受野,后者的效率却更高。第二组则是对通道维度的卷积进行因式分解,如下图所示:

4.4.2 组卷积

 组卷积就是将特征通道分成不同组,在每个组上进行卷积,从而减少卷积层中参数数量。如下图所示:

                                                                                                                                                            理论上,其他条件相同情况下,将特征均匀分成m组,计算量将减少1/m。

4.4.3 深度可分离卷积

深度可分离卷积可以看作是组卷积的一种特殊情况(即组的个数和通道数相同)。使用多个1×1滤波器进行维度转换以得到具有所需通道数量的输出。通过深度可分离卷积,计算量可以从O(dk^{2}c)减少到O(ck^{2})+O(dc)。该思想可以应用于目标检测和细粒度分类。如下图所示:

  4.4.4 瓶颈设计

与前几层相比,神经网络瓶颈层包含节点较少。瓶颈的设计通常被用来设计轻量级网络。可以对输入层网络进行压缩,减少检测开始的计算量。也可以压缩特征图,加快后续检测。                        

4.4.5 NAS检测

基于深度学习的检测器越来越复杂,也严重依赖手工构建的网络架构和训练参数。神经结构搜索(Nerual Architecture Search,NAS)主要关注确定候选网络适当空间,改进快速准确搜索策略,以低成本验证搜索结果。在设计检测模型时,NAS可以减少人为干预网络骨干网和锚盒设计需求。

4.5 数值加速

数值加速旨在加速目标检测器底层实现过程。

4.5.1 积分图像加速

积分图像是图像处理的一种方法,其有助于快速图像子区域的和。本质就是信号处理中卷积的积分-微分可分性。

f(x)*g(x)=(\int f(x)dx)*(\frac{dg(x)}{dx})

其中dg(x)/dx是稀疏信号,之后卷积部分就能通过方程右边部分进行加速。

积分图像也可以用于加速更多的目标检测常见特征,如颜色直方图、梯度直方图。很典型的是通过计算积分HOG映射加速HOG,如下图所示:

积分HOG地图用于行人检测,并在不损失精度条件下加速数十倍。

4.5.2 频域加速

卷积是一种重要的运算,由于线性检测器检测可以看作是特征映射和检测器权重之间的窗口内积,通过卷积实现。傅里叶变换是一种加速卷积的方法。在适当条件下,两个信号I*W的卷积傅里叶变换F是他们傅里叶空间中的点积:

I*W=F^{-1}(F(I)\odot F(W))

F是傅里叶变换,F-1是傅里叶反变换。上述公式可以通过快速傅里叶变换和快速傅里叶反变换实现加速。

4.5.3 矢量量化

VQ(vector quantization)是信号处理的常用量化方法。通过一组小的原型向量近似一组大数据分布。可以用于数据压缩和加速目标检测内积运算。

                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                      

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39441.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LLM之RAG实战(五十二)| 如何使用混合搜索优化RAG 检索

在RAG项目中,大模型生成的参考内容(专业术语称为块)来自前一步的检索,检索的内容在很大程度上直接决定了生成的效果,因此检索对于RAG项目至关重要,最常用的检索方法是关键字搜索和语义搜索。本文将分别介绍…

2025-3-24 leetcode刷题情况(动态规划——01背包)

一、416.分割等和子集 1.题目描述 给你一个 只包含正整数 的 非空 数组 nums 。请你判断是否可以将这个数组分割成两个子集,使得两个子集的元素和相等。 2.代码 3.思路 首先进行边界检查,若数组为空则直接返回 false。接着计算数组元素总和&#xff…

Lineageos 22.1(Android 15)实现负一屏

一、前言 方案是参考的这位大佬的,大家可以去付费订阅支持一波。我大概理一下Android15的修改。 大佬的方案代码 二、Android15适配调整 1.bp调整,加入aidl引入,这样make之后就可以索引代码了 filegroup {name: "launcher-src"…

5G NR PRACH 随机接入前导序列

目录 一、前言二、随机接入前导序列的产生三、 N c s N_{cs} Ncs​的规划3.1、 L R A L_{RA} LRA​839 N c s N_{cs} Ncs​规划3.2、 L R A L_{RA} LRA​139 N c s N_{cs} Ncs​规划3.3、 N c s N_{cs} Ncs​确定方法 四、根序列的规划4.1、根序列的选择与确定4.2、循环移位 …

【VUE】day07 路由

【VUE】day07 路由 1. 路由2. 前端路由的工作方式3. 实现简易的前端路由4. 安装和配置路由4.1 安装vue-router包4.2 创建路由模块4.3 导入并挂在路由模块 5. 在路由模块中声明路由的对应关系5.1 router-view 1. 路由 在 Vue.js 中,路由(Routing&#xf…

WPS宏开发手册——使用、工程、模块介绍

目录 系列文章前言1、开始1.1、宏编辑器使用步骤1.2、工程1.3、工程 系列文章 使用、工程、模块介绍 JSA语法 第三篇练习练习题,持续更新中… 前言 如果你是开发人员,那么wps宏开发对你来说手拿把切。反之还挺吃力,需要嘻嘻&#xf…

数学概念学习

# 欧式空间 ## 定义 日常生活观察到的几何空间:一维、平面和三维空间。 ## 点与向量 是欧式空间的基本元素。 ## 距离和内积 距离:通过欧几里得距离公式计算 内积(点积): 通过两个向量的内积来测量他们的相似性&…

InnoDB 引擎核心知识点

InnoDB 引擎核心知识点 6.1 逻辑存储结构 表空间(Tablespace):所有数据逻辑上存储在一个表空间中,物理上可能由多个文件组成。段(Segment):分为数据段(B树叶子节点)、索引…

C++《红黑树》

在之前的篇章当中我们已经了解了基于二叉搜索树的AVL树,那么接下来在本篇当中将继续来学习另一种基于二叉搜索树的树状结构——红黑树,在此和之前学习AVL树类似还是通过先了解红黑树是什么以及红黑树的结构特点,接下来在试着实现红黑树的结构…

java实现coze平台鉴权+工作流调用(踩坑记录)

问题偏多建议大家看完文章后再开始实现 OAuth鉴权 https://www.coze.cn/open/docs/developer_guides/preparation https://www.coze.cn/open/docs/developer_guides/oauth_apps OAuth 授权码鉴权 https://www.coze.cn/open/docs/developer_guides/oauth_code 创建OAuth应…

2025年优化算法:龙卷风优化算法(Tornado optimizer with Coriolis force,TOC)

龙卷风优化算法(Tornado optimizer with Coriolis force)是发表在中科院二区期刊“ARTIFICIAL INTELLIGENCE REVIEW”(IF:11.7)的2025年智能优化算法 01.引言 当自然界的狂暴之力,化身数字世界的智慧引擎&…

面试题分享-多线程顺序打印奇偶数

目录 1.题目详情 2.解题思路 2.1.分析题目 2.2.解析思路 3.代码实现 4.运行结果 1.题目详情 昨天刷抖音,遇到一个面试题,描述如下: 请使用两个线程,分别顺序交替打印奇数和偶数,直到10为止。例如有两个线程&#…

QuecPython 网络协议之TCP/UDP协议最祥解析

概述 IP 地址与域名 IP 地址是网络中的主机地址,用于两台网络主机能够互相找到彼此,这也是网络通信能够成功进行的基础。IP 地址一般以点分十进制的字符串来表示,如192.168.1.1。 ​ 我们日常访问的网站,其所在的服务器主机都有…

React - LineChart组件编写(用于查看每日流水图表)

一、简单版本 LineChart.tsx // src/component/LineChart/LineChart.tsx import React, {useEffect,useRef,useImperativeHandle,forwardRef,useMemo,useCallback, } from react; import * as echarts from echarts/core; import type { ComposeOption } from echarts/core; …

医学图像分割数据集肺分割数据labelme格式6299张2类别

数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图像分辨率:1024x1024 图片数量(jpg文件个数):6299 标注数量(json文件个数):6299 标注类别数:2 标注类别名称:["leftl…

帕金森病致生活艰难,如何缓解心理负担?

你是否留意到身边有人手部不由自主地颤抖,且肢体变得僵硬,行动也愈发迟缓?这很可能是帕金森病的症状。帕金森病是一种常见的神经系统退行性疾病,多发生于中老年人。​ 静止性震颤往往是帕金森病的首发症状,患者在安静状…

从零构建大语言模型全栈开发指南:第二部分:模型架构设计与实现-2.1.1自注意力机制(Scaled Dot-Product Attention)的逐行代码实现

👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 2.1.1 自注意力机制(Scaled Dot-Product Attention)的逐行代码实现1. 自注意力机制的核心原理与数学表达1.1 注意力计算的三元组:`Q, K, V`2. 逐行代码实现与解析2.1 输入嵌入与权重矩阵初始化2.2 完…

机械臂【逆运动学】

回顾正运动学fk: IK: 几何法 代数法 六轴 456轴交再同一点 有解析解 下列公式为正运动学部分结论 a和d是长度 ,theta和alfa是角度 **疑问:alfa00? Z轴互相平行 ** 已知末端要在空间XYZ处如下 绿色项&#x…

IDEA批量替换项目下所有文件中的特定内容

文章目录 1. 问题引入2. 批量替换项目下所有文件中的特定内容2.1 右键项目的根目录,点击在文件中替换2.2 输入要替换的内容 3. 解决替换一整行文本后出现空行的问题4. 增加筛选条件提高匹配的精确度 更多 IDEA 的使用技巧可以查看 IDEA 专栏: IDEA 1. 问…

Ubuntu22.04美化MacOS主题

安装Tweaks 参考Ubuntu 22.04 桌面美化成Mac风格这篇更好点 sudo apt install gnome-tweaks gnome-shell-extensions -y安装macos主题 git clone https://github.com/vinceliuice/WhiteSur-gtk-theme.git # 进到文件目录 ./install.sh -t all -N glassy sudo ./tweaks.sh -g…