【李宏毅机器学习】注意力机制

news/2024/12/26 4:06:48/文章来源:https://blog.csdn.net/INGg__/article/details/132417419

输出

我们会遇到不同的任务，针对输出的不一样，我们对任务进行划分

给多少输出多少

在这里插入图片描述

给一堆向量，输出一个label，比如说情感分析

在这里插入图片描述

还有一种任务是由机器决定的要输出多少个label，seq2seq的任务就是这种，翻译也是

在这里插入图片描述

Sequence Labeling

如果要考虑时序信息，每次可以选取前后固定长度的信息输入到fc层，但是运算量很大需要的参数也很多

新的方法能考虑整个input sequence

在这里插入图片描述

fc专注处理某一个位置的信息，self-attention来考虑整个sequence的信息

模型细节

在这里插入图片描述

每个b都是考虑整个sequence来产生的

那么是如何产生的？

我们需要找到一些相关的向量来帮助决定 $a^1$ ，用 $\alpha$ 来表示相关的重要性

在这里插入图片描述

那么怎么决定 $\alpha$ 呢，有两种方式

在这里插入图片描述

用 $a^1$ 分别与其他的向量分别进行计算相关性

在这里插入图片描述

一般而言，也会跟自己计算相关性

在这里插入图片描述

然后接一个softmax

在这里插入图片描述

根据attention的分数，也就是计算出来的每一个 $\alpha$ 值来抽取重要的信息

在这里插入图片描述

转换为矩阵运算形式：

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

多头注意力

多头注意力是自注意力的一个进阶的版本

多头注意力的关键在于Q是有不同的多个进行询问的，这样带来的好处与卷积也比较类似，我们采用不同的Q来负责不同种类的相关性

计算方式上，与自注意力机制比较类似，每个计算过程中只关注对应的（比如计算1的时候只把1拿出来）

在这里插入图片描述

在这里插入图片描述

位置编码

有时位置的距离也比较重要，我们需要存储位置的信息

在这里插入图片描述

For Image

横着来看做一个vector，众多vector作为输入，输入进model

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/100785.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

FPGA_学习_17_IP核_ROM（无延迟-立即输出）

FPGA_学习_17_IP核_ROM（无延迟-立即输出）

由于项目中关于厂商提供的温度-偏压曲线数据已经被同事放在ROM表了，我这边可用直接调用。今天在仿真的时候，发现他的ROM表用的IP核是及时输出的，就是你地址给进去，对应地址的ROM数据就立马输出，没有延迟。我打开他的…

阅读更多...

Android开发基础知识总结（一）初识安卓Android Studio

Android开发基础知识总结（一）初识安卓Android Studio

一.基础理论知识 1.Linux相当于是地基。 MIUI，EMUI等操作系统，是基于安卓的改版——且裁掉了一部分Google的服务。 （鸿蒙虽然是改版，但和安卓的架构基本上一致） 2.Kotlin和Java都是JVM语言，必须先复习好…

阅读更多...

【三维重建】【深度学习】NeuS代码Pytorch实现--测试阶段代码解析(下)

【三维重建】【深度学习】NeuS代码Pytorch实现--测试阶段代码解析(下)

【三维重建】【深度学习】NeuS代码Pytorch实现–测试阶段代码解析(下) 论文提出了一种新颖的神经表面重建方法，称为NeuS，用于从2D图像输入以高保真度重建对象和场景。在NeuS中建议将曲面表示为有符号距离函数(SDF)的零级集，并开发一种新的体绘…

阅读更多...

3D医学教学虚拟仿真系统：身临其境感受人体结构和功能

3D医学教学虚拟仿真系统：身临其境感受人体结构和功能

3D医学教学虚拟仿真系统是一种基于虚拟现实技术的教学工具，它可以帮助学生更好地理解和掌握医学知识。这种课件通常包括人体解剖学、生理学、病理学等方面的教学内容，通过三维立体的图像和动画展示，让学生更加直观地了解人体结构和功能。与传…

阅读更多...

今天七夕，群友让我帮忙给他分配一个对象，于是我。。。

今天七夕，群友让我帮忙给他分配一个对象，于是我。。。

今天七夕，群友让我帮忙给他分配一个对象，于是我只好尝试给他分配对象了： CGirlFrined *pGF new CGirlFrined("大屌萌妹");int nRet (群友).SetGirlFriend(pGF);if (nRet ! 0) {alert("分配失败！"); }后来觉…

阅读更多...

交换机生成树STP

交换机生成树STP

生成树协议（spanning-tree-protocol,stp）：在具有物理环路的交换机网络上生成没有回路的逻辑网络的方法，生成树协议使用生成树算法，在一个具有冗余路径的容错网络中计算出一个无环路的路径，使一部分端口处于…

阅读更多...

「UG/NX」Block UI 超级截面SuperSection

「UG/NX」Block UI 超级截面SuperSection

✨博客主页何曾参静谧的博客📌文章专栏「UG/NX」BlockUI集合📚全部专栏「UG/NX」NX二次开发「UG/NX」BlockUI集合「VS」Visual Studio「QT」QT5程序设计「C/C+&#

阅读更多...

easyexcel合并单元格底色

easyexcel合并单元格底色

一、效果图二、导出接口代码 PostMapping("selectAllMagicExport")public void selectAllMagicExport(HttpServletRequest request, HttpServletResponse response) throws IOException {ServiceResult<SearchResult<TestMetLineFe2o3Export>> result …

阅读更多...

【3D激光SLAM】LOAM源代码解析--transformMaintenance.cpp

【3D激光SLAM】LOAM源代码解析--transformMaintenance.cpp

系列文章目录【3D激光SLAM】LOAM源代码解析–scanRegistration.cpp 【3D激光SLAM】LOAM源代码解析–laserOdometry.cpp 【3D激光SLAM】LOAM源代码解析–laserMapiing.cpp 【3D激光SLAM】LOAM源代码解析–transformMaintenance.cpp 写在前面本系列文章将对LOAM源代码进行讲解…

阅读更多...

Hadoop学习：深入解析MapReduce的大数据魔力（三）

Hadoop学习：深入解析MapReduce的大数据魔力（三）

Hadoop学习：深入解析MapReduce的大数据魔力（三） 3.5 MapReduce 内核源码解析3.5.1 MapTask 工作机制3.5.2 ReduceTask 工作机制3.5.3 ReduceTask 并行度决定机制 3.6 数据清洗（ETL）1）需求2）需求…

阅读更多...

python实战【外星人入侵】游戏并改编为【梅西vsC罗】（球迷整活）——搭建环境、源码、读取最高分及生成可执行的.exe文件

python实战【外星人入侵】游戏并改编为【梅西vsC罗】（球迷整活）——搭建环境、源码、读取最高分及生成可执行的.exe文件

文章目录 🎥前言💼安装Pygame🔋游戏的实现读写并存储【外星人入侵】游戏最高分游戏源码alien_invasion.pygame_functions.pyship.pyalien.pybullet.pybutton.pyscoreboard.pygame_stats.pysettings.py宇宙飞船和外星人的 .bmp类型文件 &#…

阅读更多...

Java之继承详解二

Java之继承详解二

3.7 方法重写 3.7.1 概念方法重写 ：子类中出现与父类一模一样的方法时（返回值类型，方法名和参数列表都相同），会出现覆盖效果，也称为重写或者复写。声明不变，重新实现。 3.7.2 使用场景与案例…

阅读更多...

hive表的全关联full join用法

hive表的全关联full join用法

背景：实际开发中需要用到全关联的用法，之前没遇到过，现在记录一下。需求是找到两张表的并集。全关联的解释如下； 下面建两张表进行测试 test_a表的数据如下 test_b表的数据如下； 写第一个full join 的SQL进行查询…

阅读更多...

基于 BlockQueue（阻塞队列）的生产者消费者模型

基于 BlockQueue（阻塞队列）的生产者消费者模型

文章目录阻塞队列（BlockQueue）介绍生产者消费者模型介绍代码实现lockGuard.hpp（）Task.hpp（任务类）BlockQueue.hpp（阻塞队列）conProd.cc（生产者消费者模型主进程&#…

阅读更多...

pytest自动化框架运行全局配置文件pytest.ini

pytest自动化框架运行全局配置文件pytest.ini

还记得在之前的篇章中有讲到Pytest是目前主要流行的自动化框架之一，他有基础的脚本编码规则以及两种运行方式。 pytest的基础编码规则是可以进行修改，这就是今日文章重点。看到这大家心中是否提出了两个问题：pytest的基础编码规则在哪可以…

阅读更多...

探索高效的HTTP异步接口测试方法：从轮询等待到自动化方案

探索高效的HTTP异步接口测试方法：从轮询等待到自动化方案

本文将深入探讨HTTP异步接口测试的多个方面，包括轮询等待、性能测试以及自动化方案。通过详细的解释和实际案例，帮助您了解如何有效地测试异步接口，确保系统的稳定性和性能。在现代软件开发中，HTTP异步接口扮演着至关重要的角色&…

阅读更多...

QCustomPlot绘制多条曲线在不同的位置

QCustomPlot绘制多条曲线在不同的位置

ui->setupUi(this);QCPLayoutGrid* layout ui->customPlot->plotLayout();//把之前的布局清除layout->clear();//设置行间距layout->setRowSpacing(0);layout->setColumnSpacing(0);// 2. 准备数据QVector<double> x(101), y(101);for (int i 0; i &…

阅读更多...

设计模式之代理模式（Proxy）的C++实现

设计模式之代理模式（Proxy）的C++实现

1、代理模式的提出在组件的开发过程中，有些对象由于某种原因（比如对象创建的开销很大，或者对象的一些操作需要做安全控制，或者需要进程外的访问等），会使Client使用者在操作这类对象时可能会存在问题&…

阅读更多...

Bigemap在地质工程勘察行业中的应用

Bigemap在地质工程勘察行业中的应用

Bigemap在地质工程勘察行业中的应用选择Bigemap的原因： 师兄在测绘局工作，买过全能版，帮我下载过高程数据，我觉得效果可以，于是联系到软件公司进行试用、咨询使用场景： 影像、等高线、地形等资料下载&…

阅读更多...

七夕表白前端代码

七夕表白前端代码

七夕表白前端代码，话不多说直接上代码： <!DOCTYPE html> <html> <head><title>七夕表白</title><style>body {text-align: center;font-family: Arial, sans-serif;}h1 {color: #e74c3c;}p {font-size: 18px;line-…

阅读更多...

最新文章

推荐文章