论文阅读—— BiFormer(cvpr2023)

论文阅读—— BiFormer(cvpr2023)

news/2024/12/25 12:32:19/文章来源:https://blog.csdn.net/weixin_43575791/article/details/134217741

论文：https://arxiv.org/abs/2303.08810

github：GitHub - rayleizhu/BiFormer: [CVPR 2023] Official code release of our paper "BiFormer: Vision Transformer with Bi-Level Routing Attention"

一、介绍

1、要解决的问题：transformers可以捕捉长期依赖，但是它具有很高的计算复杂性，并占用大量内存。

2、之前研究者解决这个问题的做法，一般都是稀疏注意力：

1）基于手动设计的稀疏模式：在局部窗口或空洞窗口的限制注意力

2）使得稀疏性可以自适应于数据

上面这些方法使用不同的策略融合或者选择和查询无关的键值token，这些token对所有查询共享。但是根据VIT和DETR的可视化结果，不同语义区域的查询对应不同的键值对。

3、所以作者的方法是动态的、查询相关的query-aware，找到最有相关性的键值对。

本文的想法：主要想法是先在区域级别粗略的过滤掉和查询不相关的键值对，这样留下一小部分topk选好的区域routed regions，然后在这些区域上使用细粒度token到token的细粒度注意力机制。

二、方法：

1、Bi-Level Routing Attention

1）输入图片HxWxC，分成SxS个区域，reshape到，然后求出Q,K,V

2）求相关区域

每个区域的，求区域之间的相似性矩阵，文中称为通过矩阵相乘得到的region-to-region affinity graph：，衡量了两个区域之间的语义相关性大小。然后选出topk个区域，I的第i行是最相关的k个区域的索引。

3）Token-to-token attention

为了能在GPU并行计算，先把K和V聚集在一起，然后再计算注意力：

4）分析得到的提出的BRA（Bi-Level Routing Attention）复杂度，而一般的注意力复杂度为。

2、BiFormer

BRA作为基础模块，采用四层金字塔结构。

patch merging module用来减少空间分辨率同时增加通道数。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/184222.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

OpenLayers入门，OpenLayers加载离线xyz瓦片地图并显示离线鹰眼控件

OpenLayers入门，OpenLayers加载离线xyz瓦片地图并显示离线鹰眼控件

专栏目录： OpenLayers入门教程汇总目录前言本章介绍如何使用OpenLayers加载离线xyz瓦片地图图层，并显示离线xyz瓦片的鹰眼控件。本章是综合案例，涉及到两块内容，一个是离线瓦片地图加载，二个是鹰眼控件，拆分的参考文章如下： OpenLayers入门，OpenLayers地图鹰眼控…

阅读更多...

Java面试题（每天10题）-------连载（26）

Java面试题（每天10题）-------连载（26）

目录多线程篇 1、什么是FutureTask？ 2、什么是同步容器和并发容器的实现？ 3、什么是多线程的上下文切换？ 4、ThreadLocal的设计理念与作用？ 5、ThreadPool（线程池）用法与优势？ 6、Concur…

阅读更多...

智能文件改名：高效复制并删除冗余，简化文件管理“

智能文件改名：高效复制并删除冗余，简化文件管理“

在繁杂的电脑文件世界中，如何高效地管理文件成为了许多人的难题。为了解决这一难题，我们推出了一款智能文件改名工具，它能够轻松复制文件并删除目标文件夹中的冗余文件，让您的文件管理更加高效便捷。第一步，我们要打…

阅读更多...

【网络协议】聊聊HTTPDNS如何工作的

【网络协议】聊聊HTTPDNS如何工作的

传统 DNS 存在哪些问题？ 域名缓存问题我们知道CND会进行域名解析，但是由于本地会进行缓存对应的域名-ip地址，所以可能出现过期数据的情况。域名转发问题出口 NAT 问题域名更新问题解析延迟问题因为在解析DNS的时候，需要进行…

阅读更多...

Flink--Data Source 介绍

Flink--Data Source 介绍

Data Source 简介 Flink 做为一款流式计算框架，它可用来做批处理，即处理静态的数据集、历史的数据集；也可以用来做流处理，即实时的处理些实时数据流，实时的产生数据流结果，只要数据源源不断的过来&#xff…

阅读更多...

Spring的缓存机制-循环依赖

Spring的缓存机制-循环依赖

群公告 Java每日大厂面试题： 1、Spring 是如何解决循环依赖？ 答案：三级缓存，简单来说，A创建过程中需要B，于是A将自己放到三级缓存里面，去实例化B，B实例化的时候发现需要…

阅读更多...

【AICFD案例教程】进气歧管分析

【AICFD案例教程】进气歧管分析

AICFD是由天洑软件自主研发的通用智能热流体仿真软件，用于高效解决能源动力、船舶海洋、电子设备和车辆运载等领域复杂的流动和传热问题。软件涵盖了从建模、仿真到结果处理完整仿真分析流程，帮助工业企业建立设计、仿真和优化相结合的一体化流程&#x…

阅读更多...

CSS时间线样式

CSS时间线样式

css实现时间线样式，效果如下图： 一、CSS代码 .timeline {padding-left: 5px} .timeline-item { position: relative;padding-bottom: 20px;} .timeline-axis {position: absolute;left: -5px;top: 0;z-index: 10;width: 20px;height: 20px;line-he…

阅读更多...

Android Studio报错：connect refused

Android Studio报错：connect refused

参考链接： https://blog.csdn.net/qq_43213783/article/details/113936012 参考文章中说报错主要是由于代理导致的，在文件->设置->外观与行为->系统设置->HTTP代理。方法一： 查看打开代理（前提是代理可以通网&#x…

阅读更多...

数据可视化PCA与t-SNE

数据可视化PCA与t-SNE

PCA（主成分分析）和t-SNE（t分布随机近邻嵌入）都是降维技术，可以用于数据的可视化和特征提取。降维：把数据或特征的维数降低，其基本作用包括： 提高样本密度，以及使基于欧…

阅读更多...

实验（一）：运算器实验

实验（一）：运算器实验

一、实验内容与目的实验要求： 利用 CP226 实验仪的 K16..K23开关做为DBUS数据，其它开关做为控制信号，将数据写累加器A和工作寄存器W，并用开关控制ALU的运算方式，实现运算器的功能，将结果送入OUT寄存器。实…

阅读更多...

C# TCP Server服务端多线程监听RFID读卡器客户端上传的读卡数据

C# TCP Server服务端多线程监听RFID读卡器客户端上传的读卡数据

本示例使用设备介绍：液显WIFI无线网络HTTP协议RFID云读卡器可编程实时可控开关TTS语-淘宝网 (taobao.com) using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using Sy…

阅读更多...

EM@解三角形@正弦定理@余弦定理

EM@解三角形@正弦定理@余弦定理

文章目录 abstract解三角形基本原理不唯一性正弦定理直角三角形中的情形推广锐角三角形钝角情形小结:正弦定理余弦定理直角三角形中的情形非直角情形小结:余弦定理公式的角余弦形式 abstract 解直角三角形问题正弦定理和余弦定理的推导对于非直角情形,都是直角情形的推广同…

阅读更多...

机器视觉的试卷批改系统 - opencv python 视觉识别计算机竞赛

机器视觉的试卷批改系统 - opencv python 视觉识别计算机竞赛

文章目录 0 简介1 项目背景2 项目目的3 系统设计3.1 目标对象3.2 系统架构3.3 软件设计方案 4 图像预处理4.1 灰度二值化4.2 形态学处理4.3 算式提取4.4 倾斜校正4.5 字符分割 5 字符识别5.1 支持向量机原理5.2 基于SVM的字符识别5.3 SVM算法实现 6 算法测试7 系统实现8 最后 0…

阅读更多...

微服务架构深入理解 | 技术栈

微服务架构深入理解 | 技术栈

💗wei_shuo的个人主页 💫wei_shuo的学习社区 🌐Hello World ！ 微服务架构深入理解 | 技术栈服务网关服务网关是在微服务架构中扮演重要角色的组件，它是系统对外的入口，负责接收和处理客户端的请求&#x…

阅读更多...

【算法 | 模拟No.3】leetcode 38. 外观数列

【算法 | 模拟No.3】leetcode 38. 外观数列

个人主页：兜里有颗棉花糖欢迎点赞👍 收藏✨ 留言✉ 加关注💓本文由兜里有颗棉花糖原创收录于专栏【手撕算法系列专栏】【Leetcode】 🍔本专栏旨在提高自己算法能力的同时，记录一下自己的学习过程，希望…

阅读更多...

鸿蒙原生应用开发-DevEco Studio超级终端模拟器的使用

鸿蒙原生应用开发-DevEco Studio超级终端模拟器的使用

一、了解超级终端模拟器支持的设备情况该特性在DevEco Studio V2.1 Release及更高版本中支持。目前超级终端模拟器支持“PhonePhone”、“PhoneTablet”和“PhoneTV”的设备组网方式，开发者可以使用该超级终端模拟器来调测具备跨设备特性的应用/服务，如…

阅读更多...

中远麒麟堡垒机SQL注入漏洞复现

中远麒麟堡垒机SQL注入漏洞复现

简介中远麒麟堡垒机用于运维管理的认证、授权、审计等监控管理，在该产品admin.php处存在SQL 注入漏洞。漏洞复现 FOFA语法： body"url\"admin.php?controlleradmin_index&actionget_user_login_fristauth&username" 或者 c…

阅读更多...

redis: 记录一次线上redis内存占用过大问题解决过程

redis: 记录一次线上redis内存占用过大问题解决过程

引言记录一次线上redis占用过大的排查过程，供后续参考问题背景测试同事突然反馈测试环境的web系统无法登陆，同时发现其他子系统也存在各类使用问题排查过程 1、因为首先反馈的是测试环境系统无法登陆，于是首先去查看了登陆功能的报错…

阅读更多...

【STM32】HAL库UART含校验位的串口通信配置BUG避坑

【STM32】HAL库UART含校验位的串口通信配置BUG避坑

【STM32】HAL库UART含校验位的串口通信配置BUG避坑文章目录 UART协议校验位HAL库配置含校验位的串口配置BUG避坑附录：Cortex-M架构的SysTick系统定时器精准延时和MCU位带操作SysTick系统定时器精准延时延时函数阻塞延时非阻塞延时位带操作位带代码位带宏定义总线函…

阅读更多...

最新文章

推荐文章