19 注意力机制

19 注意力机制

news/2025/1/11 14:52:41/文章来源:https://blog.csdn.net/kaszxc/article/details/140917339

目录

- 1.注意力机制
- - 从心理学的角度出发
  - 注意力机制
  - 非参注意力池化层
  - Nadaraya-Watson 核回归：
  - 总结
  - 注意力汇聚：Nadaraya-Watson 核代码实现
  - - 非参数注意力汇聚（非参数注意力池化）
    - 注意力权重
    - 参数注意力汇聚（参数注意力池化）
- 2.注意力分数
- - 如何将 key 和 value 拓展到更高的维度
  - 掩蔽 softmax 操作（masked softmax operation）
  - 注意力分数函数 α 的设计
  - - 1、加性注意力（Additive attention）
    - 2、缩放点积注意力（Scaled Dot-Product Attention）
  - 总结
  - 代码实现

1.注意力机制

从心理学的角度出发

动物需要在复杂的环境下有效地关注值得注意的点
心理学框架：人类根据随意线索（主动、有意识）和不随意线索选择注意点

注意力机制

卷积、全连接、池化层都只考虑不随意线索（没有明确的目标）

池化操作通常是将感受野范围中的最大值提取出来（最大池化）
卷积操作通常是对输入全部通过卷积核进行操作，然后提取出一些比较明显的特征
注意力机制是显式地考虑随意线索
- 随意线索被称之为查询（query）---- 所想要做的事情
- 每个输入是一个值（value）和不随意线索（key）的对 ---- 可以理解为环境，就是一些键值对，key 和 value 可以相同，也可以不同
- 通过注意力池化层来有偏向性地选择某些输入 ---- 根据 query （想要的）有偏向地选择输入，跟之前的池化层有所不同，这里显式地加入了 query，然后根据 query 查询所需要的东西

非参注意力池化层

<

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/391806.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Bug 解决 | 后端项目无法正常启动，或依赖服务连接失败

Bug 解决 | 后端项目无法正常启动，或依赖服务连接失败

目录 1、版本问题 2、依赖项问题明明拷贝的代码，为什么别人行，我启动就报错？ 这篇文章我就理一下最最常见的项目启动报错的两种原因！ 1、版本问题比如明明项目的 Java 版本是 8，你非得拿 5 跑？那不是…

阅读更多...

C++基础知识（入门章）

C++基础知识（入门章）

绪论历经千辛万苦，我们终于来到了一个全新的板块---C。本期的内容主要是关于C的一些基础知识的初步了解。让我们一起努力，克服编程路上的艰难险阻，迎接属于自己成功的彼岸~ C的发展历史 1979年 C的起源可以追溯到1979年，当时B…

阅读更多...

基于K210智能人脸识别+车牌识别系统（完整工程资料源码）

基于K210智能人脸识别+车牌识别系统（完整工程资料源码）

运行效果： 基于K210的智能人脸与车牌识别系统工程目录： 运行效果： 目录： 前言： 一、国内外研究现状与发展趋势二、相关技术基础 2.1 人脸识别技术 2.2 车牌识别技术三、智能小区门禁系统设计 3.1 系统设计方案 3.2 …

阅读更多...

卓越运营必备神器：规划复杂项目、使用标准的项目模板，看Minitab Workspace！

卓越运营必备神器：规划复杂项目、使用标准的项目模板，看Minitab Workspace！

可确保过程与产品卓越性的可视化工具您是否知道Minitab Workspace是专门为Minitab统计软件配套而设计的？ 您和您的团队或许会面临以下相关问题: 1) 在规划复杂项目上存在困难，如业务优化项目; 2) 因完成工作需要而使用多种未知品牌的产品; 3) 缺乏…

阅读更多...

一款好用的开源网站内容管理系统

一款好用的开源网站内容管理系统

今天给大家介绍的是一款开源网站内容管理系统（灵活、易用，性能良好、运行稳定，轻松管理建设网站） 官网：https://www.ujcms.com/ 介绍客户端兼容Edge（Chromium版）、谷歌浏览器（Chro…

阅读更多...

AI称重收银一体秤

系统介绍专门为零售行业的连锁店量身打造的收银系统，适用于常规超市、生鲜超市、水果店、便利店、零食专卖店、服装店、母婴用品、农贸市场等类型的门店使用。同时线上线下数据打通，线下收银的数据与小程序私域商城中的数据完全同步，如商品…

阅读更多...

MMC和eMMC的区别

MMC和eMMC的区别

MMC 和 eMMC 的区别 1. MMC MMC（MultiMediaCard）是一种接口协议，定义了符合这一接口的内存器，称为 MMC 储存体或 MMC 卡。它是一种非易失性存储器件，广泛应用于消费类电子产品中。 1.1 外观及引脚定义 MMC卡共有七个…

阅读更多...

LLM之本地部署GraphRAG（GLM-4+Xinference的embedding模型）（附带ollma部署方式）

LLM之本地部署GraphRAG（GLM-4+Xinference的embedding模型）（附带ollma部署方式）

前言有空再写微软开源的GraphRAG默认是使用openai的接口的（GPT的接口那是要money的），于是就研究了如何使用开源模型本地部署。源码地址：https://github.com/microsoft/graphrag 操作文档：https://microsoft.git…

阅读更多...

nextjs 实现TodoList网页应用案例

nextjs 实现TodoList网页应用案例

参考： https://nextjs.org/ Next.js 是用于网络的一种 React 框架。一些世界上最大的公司在使用它，它能够借助 React 组件的力量让您创建高质量的网络应用程序。 1、创建项目： 另外注意：pages与app路由存在冲突，如果有…

阅读更多...

Jenkins未授权访问漏洞 *

Jenkins未授权访问漏洞 *

漏洞复现步骤一：使用以下fofa语法进行产品搜索.... port"8080" && app"JENKINS" && title"Dashboard [Jenkins]" 步骤二：在打开的URL中...点击Manage Jenkins --> Scritp Console在执行以下命令..…

阅读更多...

leetcode数论(3044. 出现频率最高的质数)

leetcode数论(3044. 出现频率最高的质数)

前言经过前期的基础训练以及部分实战练习，粗略掌握了各种题型的解题思路。现阶段开始专项练习。描述给你一个大小为 m x n 、下标从 0 开始的二维矩阵 mat 。在每个单元格，你可以按以下方式生成数字： 最多有 8 条路径可以选择&#xff1…

阅读更多...

通俗易懂！495页看漫画学Python入门教程（全彩版）Git首发破万Star

通俗易懂！495页看漫画学Python入门教程（全彩版）Git首发破万Star

前言在编程的世界里，Python无疑是一颗璀璨的明星。从最初作为打发圣诞节闲暇时间的项目，到如今成为最受欢迎的程序设计语言之一，Python以其简洁、易学、强大的特点吸引了无数编程爱好者。然而，对于初学者来说，编程的…

阅读更多...

【redis 第八篇章】链表结构

【redis 第八篇章】链表结构

一、数组和链表 1、数组数组会在内存中开辟一块连续的空间存储数据，这种存储方式有利也有弊端。当获取数据的时候，直接通过下标值就可以获取到对应的元素，时间复杂度为 O(1)。但是如果新增或者删除数据会移动大量的数据，时间复…

阅读更多...

范伟：大叔这句是咱俩合唱的，赵本山：我唱不上去！——小品《门神》（下）的台词与解说

范伟：大叔这句是咱俩合唱的，赵本山：我唱不上去！——小品《门神》（下）的台词与解说

范伟：大叔这句是咱俩合唱的，赵本山：我唱不上去！ ——小品《门神》（下）的台词与解说 （接上） 范伟：大叔快快快走赵本山：干啥范伟：上咱家过年…

阅读更多...

苹果手机锁屏怎么设置？3个技巧，教你快速设置

在科技与创意交织的时代，苹果手机以其简约而不失优雅的设计，成为了我们日常生活中不可或缺的一部分。而作为手机的【第一印象】，锁屏界面更是彰显用户个性的关键所在。那么，苹果手机锁屏怎么设置呢？接下来，…

阅读更多...

AI生成PPT？三款工具让总结更轻松

AI生成PPT？三款工具让总结更轻松

哎呀，职场新人们，你们是不是也跟我一样，刚开始做PPT的时候，感觉像是走进了一个大迷宫，脑袋里装满了想法，但就是不知道怎么把它们变成一页页漂亮的幻灯片？别急，今天咱们就来聊聊三个超…

阅读更多...

【C++】C++特性揭秘：引用与内联函数 | auto关键字与for循环 | 指针空值

【C++】C++特性揭秘：引用与内联函数 | auto关键字与for循环 | 指针空值

C语法相关知识点可以通过点击以下链接进行学习一起加油！命名空间缺省参数与函数重载本章将分享C增加的几种常见特性，主要内容为引用与内联函数 | auto关键字与for循环 | 指针空值，这些知识看似很多，实际也不少。本章篇幅长&#…

阅读更多...

C# Unity 面向对象补全计划七大原则之里氏替换

C# Unity 面向对象补全计划七大原则之里氏替换

本文仅作学习笔记与交流，不作任何商业用途，作者能力有限，如有不足还请斧正本系列作为七大原则和设计模式的进阶知识，看不懂没关系请看专栏：http://t.csdnimg.cn/mIitr，尤其是关于继承的两篇文章&#xff…

阅读更多...

形参和实参的运用

形参和实参的运用

形式参数：定义函数时括号中的变量。只有被调用时才被初始化，函数调用完成后自动销毁，只在函数中有效。实际参数：真实传递给函数的参数，可以是常量、变量、表达式、函数等。无论实参是何种类型，在调用函数…

阅读更多...

DBMS 与 RDBMS

DBMS 与 RDBMS

DBMS 与 RDBMS 了解数据库什么是数据库管理系统？Types of DBMS 数据库管理系统的类型T数据库管理系统的好处关系型数据库管理系统的优点【纪录片】中国数据库前世今生在数字化潮流席卷全球的今天，数据库作为IT技术领域的“活化石”，已成为…

阅读更多...

最新文章

推荐文章