【IJCAI2024】LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens

【IJCAI2024】LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens

news/2024/11/9 4:48:07/文章来源:https://blog.csdn.net/gaopursuit/article/details/140053840

【IJCAI2024】LeMeViT: Efficient Vision Transformer with Learnable Meta Tokens for Remote Sensing Image Interpretation
论文：https://arxiv.org/abs/2405.09789
代码：https://github.com/ViTAE-Transformer/LeMeViT

请添加图片描述

由于相邻像素和图像块之间的高度相关性，以及遥感图像中纹理和模式的重复性质，存在大量的空间冗余。如下图所示，ViT 中的自注意力机制计算每两个图像块之间的相似性，相似的token对特征表示的贡献很小，但消耗了大量的计算负载，影响了模型性能。
请添加图片描述

为此，作者提出了下图所示的框架。本质上引入了一个可学习的 meta token（类似于原型或者记忆），不断的进行 image token 和 meta token 的信息交换。值得注意的是，网络的浅层使用的是cross-attention，深层使用的是自注意力（作者解释是自注意力的性能更高）。

请添加图片描述

作者在语义分割、目标检测等多个应用上做了大量实验，结果表明该方法具有较好的性能。有个有趣的消融实验是meta token 长度对性能的影响。长度为 64、32、16 和 8时，准确率几乎相同。这进一步证实了注意力计算的冗余，表明使用较少数量的 meta token 来表示密集图像 token 的动机。最后，考虑到效率和准确性，作者选择 16 作为 meta token 长度的默认设置。

请添加图片描述

作者还可视化了 dual cross attention最后一个块中，交叉注意映射结果。自然图像上的实验结果表明，学习到的 meta token 可以很好地关注图像中的目标，有助于提高分类精度。遥感图像上的实验结果则表明不同的 meta token 负责图像的不同语义部分。

请添加图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/363420.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Solana最新上线的Blink功能引爆加密圈：杀手级应用还是花拳绣腿？

Solana最新上线的Blink功能引爆加密圈：杀手级应用还是花拳绣腿？

近日，Solana推出了其最新功能——Blink，这一功能迅速引爆了加密圈的讨论。Blink功能能够将链上的操作，如交易、投票、支付、铸币等转化为一个可分享的链接或二维码，允许用户在不跳转其他页面的情况下直接在推特上完成上述链上操作…

阅读更多...

【代码工厂】简单地图生成

【代码工厂】简单地图生成

要求 （图片来自codingame） 代码 # 定义一个函数，用于生成模式 def generate_pattern(n, a, border_char): # 初始化一个空列表，用于存储生成地图pattern []# 最上面那一行的处理line n * border_charpattern.append(line)# 遍…

阅读更多...

建投数据人力资源管理系统APP完成迭代升级

建投数据人力资源管理系统APP完成迭代升级

近日，建投数据人力资源管理系统APP完成迭代升级。此次升级思路，遵循提升移动应用的功能和用户体验；直观的界面、快速的响应速度和安全的数据存储；个性化的功能，以满足不同员工的需求和使用偏好。人力资源管理系统A…

阅读更多...

行业推荐！IG5216量产工具下载，IG5216开卡软件分享

行业推荐！IG5216量产工具下载，IG5216开卡软件分享

国内固态硬盘常用，且有量产工具流传出来的主控厂商包括慧荣、群联、点序、英韧、得一微、瑞昱、联芸、迈威、国科、华澜微等等。每个主控需要用各自对应的量产工具，不同的量产工具支持的闪存颗粒也有差异，因此要根据固态硬盘实际的主控型号…

阅读更多...

SpringBoot集成道历（实现道历日期查询）

SpringBoot集成道历（实现道历日期查询）

官网地址：官网地址https://6tail.cn/calendar/api.html 1、导入依赖 <dependency><groupId>cn.6tail</groupId><artifactId>lunar</artifactId><version>1.3.9</version></dependency><dependency><group…

阅读更多...

【UE5.3】笔记6-第一个简单小游戏

【UE5.3】笔记6-第一个简单小游戏

打砖块小游戏： 1、制造一面砖块组成的墙在关卡中放置一个cube，放这地面上，将其转换成蓝图类,改名BP_Cube，更换砖块的贴图，按住alt键进行拷贝，堆出一面墙，复制出来的会很多，全选移动…

阅读更多...

Servlet工作原理

Servlet工作原理

Servlet 工作原理编写Servlet 创建servlet 创建一个MyServlet继承HttpServlet，重写doGet和doPost方法，也就是看请求的方式是get还是post，然后用不同的处理方式来处理请求， 2. 配置Servlet //添加参数 <servlet><se…

阅读更多...

项目开发 TCP-Socket连接功能实现（Android端）

项目开发 TCP-Socket连接功能实现（Android端）

前段时间在公司做项目的时候遇到了一个功能需要使用TCP-Socket连接硬件设备进行通信，查了很多资料也只是关于HTTP-Socket相关的，没法满足项目的要求，后来查到一个相关的插件，现在有时间和大家分享一下。项目简单介绍&#xff1a…

阅读更多...

来聊聊nacos

来聊聊nacos

先关注下下方公众号呗： 第1部分：引言微服务的挑战尽管微服务架构带来了许多好处，如敏捷性、可扩展性和容错性，但它也带来了一些挑战，特别是在服务发现、配置管理、服务间通信和运维管理方面。这些挑战需要有效的解…

阅读更多...

经验分享之会员 SaaS 系统

经验分享之会员 SaaS 系统

前言 2018年，这是不平凡的一年；互联网行业的中台战略、会员经济等模式如火如荼，同时也逐渐地走入我们公司每个人的视野。在南海集团的战略规划背景下，当时我所在的公司作为集团的研发中心，承担了对会员 SaaS 系统的建…

阅读更多...

一个人三个月干了二十万

一个人三个月干了二十万

相信很多人是被这个标题吸引进来的，但我并不是标题党，我也很讨厌标题党，这篇文章也不在乎流量，更多的是想记录下。出来创业三个多月了，给大家汇报一下这段时间的业绩吧。一个人，三个多月，干了…

阅读更多...

北邮《计算机网络》传输层笔记

北邮《计算机网络》传输层笔记

内容一览缩写复习单词复习传输层前言传输协议的要点拥塞控制UDPTCP VS UDPTCP 缩写复习 AIMD XCP ECN WFQ max-min-fair ARQ PAWS TSAP NSAP TCP UDP RTT SCTP SACK NAK RST MSS 单词复习 inverse multiplexing(SCTP) convergence crashed machine protocol scenarios asym…

阅读更多...

针对VMWare无法使用鼠标功能键问题

针对VMWare无法使用鼠标功能键问题

在使用 VMWare 虚拟机的Ubuntu系统时发现无法使用许多鼠标带有额外的功能键，比如常用的前进后退，但是双系统中的Ubuntu没有问题，后来一搜发现是，虚拟系统中不支持这些功能键。因此我们对这个问题进行了解决。解决方案 1.找到自…

阅读更多...

bable 【实用教程】

bable 【实用教程】

简介 bable 用于将 ES6 的语法编译为 ES5 只关心语法，不关心 API 是否正确。不处理模块化（webpack 会处理） 搭建开发环境安装相关的包 npm i babel/cli babel/core babel/preset-env新建文件 .babelrc，内容为 { "presets…

阅读更多...

已解决javax.transaction.InvalidTransactionException：事务无效的正确解决方法，亲测有效！！！

已解决javax.transaction.InvalidTransactionException：事务无效的正确解决方法，亲测有效！！！

已解决javax.transaction.InvalidTransactionException：事务无效的正确解决方法，亲测有效！！！ 目录问题分析报错原因解决思路解决方法 1. 确保事务的正确启动和结束 Spring中的事务管理 2. 避免嵌套事务问题…

阅读更多...

Linux显示服务器Wayland切换到X11

Linux显示服务器Wayland切换到X11

1、临时切换 ： 注销当前用户账户，返回到登录屏幕。在登录屏幕上，选择您要登录的用户账户。在输入密码之前，在登录屏幕的右下角可能有一个齿轮图标，点击它以展开更多选项。在选项中选择“Ubuntu on Xorg”或“Ubu…

阅读更多...

【uml期末复习】统一建模语言大纲

【uml期末复习】统一建模语言大纲

前言： 关于uml的期末复习的常考知识点，可能对你们有帮助😉 目录第一部分概念与基础第一章面向对象技术第二章统一软件过程第三章 UML概述第四章用例图第五章类图第六章对象图第七章顺序图第八章协作图第九章状态…

阅读更多...

【应用开发二】GPIO操控（输出、输入、中断）

【应用开发二】GPIO操控（输出、输入、中断）

1 操控GPIO方式控制目录：/sys/class/gpio /sys/class/gpio目录下文件如下图所示： 1.1 gpiochipX目录功能：当前SoC所包含的所有GPIO控制器 i.mx6ull一共包含5个GPIO控制器，分别为GPIO1~5分别对应gpiochip0、gpiochip32、gpi…

阅读更多...

基于java语言+springboot技术架构开发的互联网智能3D导诊系统源码支持微信小程序、APP 医院AI智能导诊系统源码

基于java语言+springboot技术架构开发的互联网智能3D导诊系统源码支持微信小程序、APP 医院AI智能导诊系统源码

基于java语言springboot技术架构开发的互联网智能3D导诊系统源码支持微信小程序、APP 医院AI智能导诊系统源码一、智慧导诊系统开发原理导诊系统从原理上大致可分为基于规则模板和基于数据模型两类。 1、基于规则推理的方法通过人工建立症状、疾病和科室之间的对应规则实现…

阅读更多...

【uniapp】uniapp开发微信小程序入门教程

【uniapp】uniapp开发微信小程序入门教程

HBuilderx中uniapp开发微信小程序入门教程一、环境搭建 1. HBuilderx下载安装 HBuilderx下载安装地址 2. 微信开发者工具下载安装微信开发者工地址具下载安装二、创建uniapp项目选择：文件>新建>项目>uni-app 输入项目名称>选择默认模板>…

阅读更多...

最新文章

推荐文章