LLM- 注意力机制

LLM- 注意力机制

news/2024/11/13 8:04:47/文章来源:https://blog.csdn.net/zg260/article/details/140282088

一：什么是注意力机制，以及产生背景？

（1）：RNN模型[RNN模型]的缺点：下图是例如RNN模型解决机器翻译的例子，从这个例子可以看到Encoder最后一个向量（eos）送给了Decoder端，因为Decoder端要输出一个完整的正确的句子，这就要求Encoder端的最后一个向量(eos)表示要包含这个句子的完整信息。但是这样一个向量能够表达句子中所有信息吗，答案是否定的，由于向量容量的限制，向量包含的信息是有限的。会显著限制RNN模型Encoder端的信息表达，这就是RNN有信息瓶颈的问题。

（2）：其实RNN模型中每一个位置的隐向量，都包含有丰富的信息，而最后一个向量(eos)其实就是Encoder端和Deocder端的信息瓶颈。而本节将要介绍的注意力机制就是为了解决信息瓶颈而提出的。

（3）：注意力机制的核心思想就是就是在Decoder的每一步都把Encoder端的所有的向量都提供给Decoder模型，这样Decoder根据自己当前状态来自主选择所需要的向量。这样就可以解决信息瓶颈的问题。

二：注意力机制详细描述：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/372275.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

bdeaver mysql忘记localhost密码修改密码添加用户

bdeaver mysql忘记localhost密码修改密码添加用户

描述 bdeaver可以连接当前的localhost数据库，但不知道数据库密码是什么。用这个再建一个用户，用来连接数据库解决 1、在当前的数据库localhost右键，创建-用户设置这个用户，密码加权限 2、连接用新的账号密码去连接&#x…

阅读更多...

Keepalived+LVS实现负责均衡，高可用的集群

Keepalived+LVS实现负责均衡，高可用的集群

Keepalived的设计目标是构建高可用的LVS负载均衡群集，可以调用ipvsadm工具来创建虚拟服务器，管理服务器池，而不仅仅用作双机热备。使用Keepalived构建LVS群集更加简便易用，主要优势体现在：对LVS负责调度器实现热备切换…

阅读更多...

【购物车案例】for循环为什么使用key

【购物车案例】for循环为什么使用key

要做出一个简单的购物车界面。首先，有一个复选框，可以选择商品，后面紧跟的是商品名称，然后，是删除按钮，根据这个需求，先写出一个简单的界面，代码如下： <template>…

阅读更多...

1.8-word2vec的改进

1.8-word2vec的改进

文章目录 1问题分析一2改进一之Embedding层2.1 Embedding层的实际作用2.2数组切片获取某行的操作2.3 Embedding层的实现2.3.1初始化2.3.2前向计算2.3.3反向传播 3问题分析二4改进二之将多分类变为二分类4.1二分类问题4.1.1概率转换与损失计算4.1.2反向传播4.1.3多分类与二分类的…

阅读更多...

2025 百度提前批校招内推

2025 百度提前批校招内推

百度2025校园招聘内推开始啦，被推荐人可以免笔试直接面试，提前批结果不影响校招，机会1，还可直推心仪部门，可扫描下面二维码或点击链接进行投递，快来投递你心仪的职位吧（ 网申链接地址 &#xff…

阅读更多...

【面向就业的Linux基础】从入门到熟练，探索Linux的秘密（十）-git（2）

【面向就业的Linux基础】从入门到熟练，探索Linux的秘密（十）-git（2）

下面是一些git的常用命令和基本操作，可以当做平常的笔记查询，用于学习！！！ 文章目录前言一、git 二、git常用命令总结前言下面是一些git的常用命令和基本操作，可以当做平常的笔记查询，用于…

阅读更多...

第十四届蓝桥杯省赛C++B组F题【岛屿个数】题解（AC）

第十四届蓝桥杯省赛C++B组F题【岛屿个数】题解（AC）

题目大意给定一个 01 地图，分别表示陆地和海，问地图中一共有多少块岛屿？另外，若一个岛屿在另一个岛屿的内部，则不统计。如下图中的大岛屿包含着内部的小岛屿，故内部小岛屿不计算，最终输出 1。…

阅读更多...

小米引入OceanBase数据库，试点业务数据库性能实现2-3倍提升

小米引入OceanBase数据库，试点业务数据库性能实现2-3倍提升

近日，小米集团确认在部分业务系统上使用蚂蚁集团自主研发的OceanBase数据库。小米智能制造依托OceanBase所提供的原生分布式数据库能力，对试点业务系统进行升级，并已稳定运行数月，不仅确保了业务连续性，还实现了性能的…

阅读更多...

Angular进阶之九： JS code coverage是如何运作的

Angular进阶之九： JS code coverage是如何运作的

环境准备需要用到的包 node 18.16.0# Javascript 代码编辑"babel/core": "^7.24.7","babel/preset-env": "^7.24.7","babel-loader": "^9.1.3",# 打包时使用的 module， 给代码中注入新的方法# http…

阅读更多...

【见刊通知】MVIPIT 2023机器视觉、图像处理与影像技术国际会议

【见刊通知】MVIPIT 2023机器视觉、图像处理与影像技术国际会议

MVIPIT 2023：https://ieeexplore.ieee.org/xpl/conhome/10578343/proceeding 入库Ei数据库需等20-50天左右第二届会议征稿启动（MVIPIT 2024） The 2nd International Conference on Machine Vision, Image Processing & Imaging Techn…

阅读更多...

解析Xml文件并修改QDomDocument的值

解析Xml文件并修改QDomDocument的值

背景： 我需要解决一个bug，需要我从xml中读取数据到QDomDocument，然后获取到我想要的目标信息，然后修改该信息。 ---------------------------------------------------------------------------------------------------------…

阅读更多...

$后端之路——登录校验前言（Cookie\ Session\ JWT令牌）$

后端之路——登录校验前言（Cookie\ Session\ JWT令牌）

前言：Servlet 【登录校验】这个功能技术的基础是【会话技术】，那么在讲【会话技术】的时候必然要谈到【Cookie】和【Session】这两个东西，那么在这之前必须要先讲一下一个很重要但是很多人都会忽略的一个知识点：【Servlet】什么是…

阅读更多...

STM32-外部中断浅析

STM32-外部中断浅析

本篇解释了STM32中断原理 MCU为什么需要中断中断，是嵌入式系统中很重要的一个功能，在系统运行过程中，当出现需要立刻处理的情况时，暂停当前任务，转而处理紧急任务，处理完毕后，恢复之前的任务…

阅读更多...

vue3项目图片压缩+rem+自动重启等plugin使用与打包配置

vue3项目图片压缩+rem+自动重启等plugin使用与打包配置

一、Svg配置每次引入一张 SVG 图片都需要写一次相对路径，并且对 SVG 图片进行压缩优化也不够方便。 vite-svg-loader插件加载SVG文件作为Vue组件，使用SVGO进行优化。插件网站https://www.npmjs.com/package/vite-svg-loader 1. 安装 pnpm i vite-svg…

阅读更多...

谷粒商城学习笔记-使用renren-fast-vue框架时安装依赖包遇到的问题及解决策略

谷粒商城学习笔记-使用renren-fast-vue框架时安装依赖包遇到的问题及解决策略

文章目录 1，npm error Class extends value undefined is not a constuctor or null2，npm warn cli npm v10.8.1 does not support Node.js v16.20.2.3，npm error code CERT_HAS_EXPIRED学习心得这篇文章记录下使用renren-fast-vue&#xff…

阅读更多...

Unity3D游戏 RPG

Unity3D游戏 RPG

丛林探险游戏人物进行探险游戏拥有登录，首页，3D物体旋转浏览的功能，还能进行种植树等功能

阅读更多...

11 个例子讲清spark提交命令参数

11 个例子讲清spark提交命令参数

目录提交命名参数详情为什么有这么多参数如何开始学习一些具体的例子1. 基本的Spark应用提交2. 提交带有依赖的Python脚本3. 运行Spark SQL作业4. 提交Spark Streaming作业5. 使用外部包运行Spark作业6. 动态资源分配7. 使用多个配置文件8. GPU 支持9. 自定义日志配置10. 使用…

阅读更多...

swiftui中NavigationStack布局navigationBarTitleDisplayMode作用，以及内容顶部空白区域解决办法

swiftui中NavigationStack布局navigationBarTitleDisplayMode作用，以及内容顶部空白区域解决办法

写了一个小demo用于学习NavigationStack和toolbar/ToolbarItem知识，但是在写一个瀑布流布局的时候，设置了顶部的toolbar，然后内容区域的顶部出现了一大片空白区域，这样的效果并不是很美观很好看，所以就想着研究解决一下…

阅读更多...

人工智能的新时代：从模型到应用的转变

人工智能的新时代：从模型到应用的转变

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

阅读更多...

Chrome 127内置AI大模型攻略

Chrome 127内置AI大模型攻略

Chrome 127 集成Gemini：本地AI功能 Google将Gemini大模型整合进Chrome浏览器，带来全新免费的本地AI体验：完全免费、无限制使用支持离线运行，摆脱网络依赖功能涵盖图像识别、自然语言处理、智能推荐等中国大陆需要借助魔法，懂都懂。安装部署步骤： 1. Chrome V127 dev …

阅读更多...

最新文章

推荐文章