即插即用篇 | YOLOv8 引入代理注意力 AgentAttention

即插即用篇 | YOLOv8 引入代理注意力 AgentAttention

news/2024/12/26 22:22:19/文章来源:https://blog.csdn.net/weixin_43694096/article/details/143693822

在这里插入图片描述

Transformer模型中的注意力模块是其核心组成部分。虽然全局注意力机制具有很强的表达能力，但其高昂的计算成本限制了在各种场景中的应用。本文提出了一种新的注意力范式，称为“代理注意力”（Agent Attention），以在计算效率和表示能力之间取得平衡。代理注意力使用四元组(Q, A, K, V)，引入了一组额外的代理token A。在此框架中，代理token首先充当查询token Q的代理，从K和V中聚合信息，然后将信息回传给Q。通过设计较少数量的代理token，代理注意力比常用的Softmax注意力效率更高，同时保留了全局上下文建模的能力。此外，本文展示了代理注意力等价于广义线性注意力的形式，因此它无缝结合了Softmax注意力的强大能力和线性注意力的高效特性。实验结果表明，代理注意力在各种视觉Transformer和视觉任务中表现出色，特别是在高分辨率场景中，代理注意力显示出其线性注意力特性，显著加速生成过程并提升图像质量。代码已公开在Github上。

论文英文原名称: “Agent Attention: On the Integration of Softmax and Linear Attention”

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/469875.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

从0开始学PHP面向对象内容之（常用魔术方法续一）

从0开始学PHP面向对象内容之（常用魔术方法续一）

常用魔术方法（续） 上期我们讲到几个常用的魔术方法，但是由于篇幅过程且全是文字性质地东西，就没写完，篇幅太长也会丧失阅读兴趣，我尽量控制一篇文章在5000字左右一、__isset()&&__unset() 1、在…

阅读更多...

【MySQL】数据库知识突破：数据类型全解析与详解

【MySQL】数据库知识突破：数据类型全解析与详解

前言：本节内容讲述MySQL的数据类型， 我们在学习之前的建表的时候已经用过各种各样的数据类型。比如int、varchar、char类型等等。其中它们是对表的结构的操作， 并没有对数据的内容进行操作，所以它叫做DDL。另外，还有…

阅读更多...

windows 11编译安装ffmpeg(包含ffplay)

windows 11编译安装ffmpeg(包含ffplay)

一、源码及安装包下载 1.1，ffmpeg源码包下载下载地址：Download FFmpeg 1.2，mysys下载下载地址：MSYS2 1.3，libx264源码包下载下载地址：x264, the best H.264/AVC encoder - VideoLAN 二、软件安装 2.1&…

阅读更多...

从0开始深度学习（28）——序列模型

从0开始深度学习（28）——序列模型

序列模型是指一类特别设计来处理序列数据的神经网络模型。序列数据指的是数据中的每个元素都有先后顺序，比如时间序列数据（股票价格、天气变化等）、自然语言文本（句子中的单词顺序）、语音信号等。 1 统计工具前面介绍…

阅读更多...

$【考研数学：高数2】数列极限$

【考研数学：高数2】数列极限

目录前言一、数列极限的概念 1.常见前n项和 2.等差、等比数列 3.数列的性质 （1）单调性 （2）有界性二、数列极限的定义三、收敛数列的性质 1.概念 2.例题四、极限的四则运算五、海涅定理（归结原则&…

阅读更多...

计算机网络分析题

计算机网络分析题

网络的布置根据具体需求布置网络第二小题、网络的划分根据路由表作出路由器拓扑图 ARP跨网络寻址 TCP报文段格式概念网桥的转发表与动作网络嗅探报文十六进制化作十进制嗅探以太网帧首部除MAC帧以外，其他各层协议数据单元都是源地址在前，目…

阅读更多...

PHP爬虫快速获取京东商品详情（代码示例）

PHP爬虫快速获取京东商品详情（代码示例）

在当今互联网时代，数据的重要性不言而喻。对于电商领域来说，获取商品信息是数据分析、市场研究和价格监控的基础。本文将介绍如何使用PHP编写一个简单的爬虫，以快速获取京东商品的详情信息。 1. 概述京东是中国领先的电商平台之一&#xff…

阅读更多...

快速学习Serde包实现rust对象序列化

快速学习Serde包实现rust对象序列化

在处理HTTP请求时，我们总是需要在数据结构对象（可以是enum、struct等）和序列化数据格式（例如JSON，用与存储或传输，并可以反序列化的格式）之间来回转换。 Serde是一个库（crate&#x…

阅读更多...

OLED 显示画面的变换操作——上下、左右翻转

OLED 显示画面的变换操作——上下、左右翻转

OLED 画面旋转 OLED 写入函数定义 OLED_WR_Byte(0xA1,OLED_CMD);//--Set SEG/Column Mapping 0xa0左右反置 0xa1正常 OLED_WR_Byte(0xC8,OLED_CMD);//Set COM/Row Scan Direction 0xc0上下反置 0xc8正常OLED 显示界面转换函数如下 void OLED_DisplayTurn(u8 i) {if(i0…

阅读更多...

由播客转向个人定制的音频频道（1）平台搭建

由播客转向个人定制的音频频道（1）平台搭建

项目的背景最近开始听喜马拉雅播客的内容，但是发现许多不方便的地方。休息的时候收听喜马拉雅，但是还需要不断地选择喜马拉雅的内容，比较麻烦，而且黑灯操作反而伤眼睛。喜马拉雅为代表的播客平台都是VOD 形式的&#xff0…

阅读更多...

luckfox-pico-max学习记录

luckfox-pico-max学习记录

0.文件编译及烧录 SDK包在文件夹/home/tao/linux/luckfox/luckfox-pico-spi应用程序样例在文件夹/home/tao/linux/luckfox-pico-spi/demo编译：sudo ./build.sh生成的镜像文件在./luckfox-pico-spi/output/image中，将所有文件复制到windows电脑文件夹I:\…

阅读更多...

一文了解珈和科技在农业遥感领域的服务内容和能力

一文了解珈和科技在农业遥感领域的服务内容和能力

2020年，农业农村部、中央网信办联合印发了《数字农业农村发展规划（2019-2025年）》，对数字农业农村建设作出了具体部署。其中，农业遥感作为推进数字农业农村的重要力量贯穿《规划》始终。今年10月，农业农村…

阅读更多...

羊城杯2020Easyphp

羊城杯2020Easyphp

审题看到url，可以想到伪协议读取尝试过后可以发现，题目绕过了read后面的编码我们可以尝试双重urlencode进行绕过 ?filephp://filter/read%25%36%33%25%36%66%25%36%65%25%37%36%25%36%35%25%37%32%25%37%34%25%32%65%25%36%32%25%36%31%25%37%33%…

阅读更多...

【时间之外】IT人求职和创业应知【34】-人和机器人，机器人更可靠

【时间之外】IT人求职和创业应知【34】-人和机器人，机器人更可靠

目录新闻一：人形机器人产业持续高速增长，2026年中国市场规模将突破200亿元新闻二：AI技术驱动设备厂商格局变化，部分厂商市占率快速提升新闻三：华为与江淮汽车携手打造超高端品牌“尊界”，计划于明年春…

阅读更多...

Linux——基础指令2 + 权限

Linux——基础指令2 + 权限

目录 1.zip/unzip 2.tar 3.bc 4.uname –r 5.重要的几个热键 6.扩展命令 7.shell命令以及运行原理 8.Linux权限的理解关于权限的三个问题： 1.目录权限 2.缺省权限 3.粘滞位 1.zip/unzip 打包、压缩：使用特定的算法，文件进行合…

阅读更多...

pgsql和mysql的自增主键差异

pgsql和mysql的自增主键差异

1. 当有历史数据存在时， mysql的自增主键是默认从最大值自增。 pgsql的自增主键取初始值开始逐个尝试，所以存在可能与历史数据的主键重复的情况。 pgsql解决上述问题的方式：重设自增值。 SELECT SETVAL(t_db_filed_id_seq, (SELECT MAX(&q…

阅读更多...

【Linux】基础IO及文件描述符相关内容详细梳理

【Linux】基础IO及文件描述符相关内容详细梳理

0. C语言文件I/O 在C语言中，我们学习了相关函数来读写文件，例如：fopen，fwrite，fread，fprintf等， 在C语言中文件的打开方式： r Open text file for reading. …

阅读更多...

大语言模型在序列推荐中的应用

大语言模型在序列推荐中的应用

一、简介序列推荐技术通过分析用户的过往交互历史，能够有效挖掘出用户可能感兴趣的项目，对于提升各类应用的服务质量具有重要作用。近期，大语言模型（LLMs）的发展在应对复杂的推荐问题上展现出了显著的优势。不过&…

阅读更多...

JavaScript——函数、事件与BOM对象

JavaScript——函数、事件与BOM对象

一、系统函数(JS中预置的函数) JS的预置函数在遇到非数字字符时会停止解析 parseInt 转整型 parseFloat 转浮点型 isNaN !isNaN("10") 检测是否纯数字 eval 把字符串转成算式并计算 1.parseInt(string, radix); 语法： string&#x…

阅读更多...

Python酷库之旅-第三方库Pandas(208)

Python酷库之旅-第三方库Pandas(208)

目录一、用法精讲 971、pandas.MultiIndex.set_levels方法 971-1、语法 971-2、参数 971-3、功能 971-4、返回值 971-5、说明 971-6、用法 971-6-1、数据准备 971-6-2、代码示例 971-6-3、结果输出 972、pandas.MultiIndex.from_arrays类方法 972-1、语法 972-2…

阅读更多...

最新文章

推荐文章