注意力机制详解(Attention详解)

注意力机制与人眼类似,例如我们在火车站看车次信息,我们只关注大屏的车次信息,而忽略大屏外其他内容,从而导致钱包被偷。。。

注意力机制只关注重点信息,忽略不重要的信息,关注最核心的内容。

主要就是这个公式,下面我来详细解释:

看不懂没关系,先看下面的示例也可以

 Q是查询语句,K是关键字,V是值。\sqrt{d_{k}}其中dk等于词向量的长度。

一、示例

第一步:搜索

淘宝搜索“笔记本”,就会弹出来一堆笔记本的列表。Q就是查询语句,就是“笔记本”,即Q=“笔记本”。

计算机不认识笔记本的中文,他就知道二进制,我们比如给笔记本赋一个向量Q=“笔记本”=[1,0,1,0,0,0,0,1];这个向量是我们随便拟定的,数值什么无所谓。

第二步:计算相似性

淘宝后台拿到这个查询Q,并用这个查询Q去和后台的所有的商品的关键字K一一的来对比,找到物品和我们查询的相似性(或者说物品对应的相似性的权重),相似性越高,越可能推送给我们。

第三步:得到价值

并且这个时候还要考虑物品的价值V,这个V不是指物品值几块钱,而是这个物品在算法中的价值。如果商家给了淘宝广告钱,或者商品物美价廉,评论好,点赞高,购买多,等等,那么算法就越有可能把物品排在前面推送给我们。

第四部:计算带权重的价值

查询语句Q乘以K,得到了相似性数值。我们拿刚刚的相似性,乘上物品在算法中的价值V,计算结果就是每件物品的最后的带相似性权重的价值,淘宝最后的算法就是返回这个带权重的价值,也就是把排好序的这些商品推送给我们。


这就是一个最典型的注意力的过程。它推送在最前面给我们的商品,肯定就是它最希望获得我们注意力的商品。当然,淘宝内部的算法肯定不是这样的,但是他们的本质都是一样的,都是基于注意力,并且我们看到的现象也都是一样的。

二、网络架构:

        向量a1与向量a2,就是下面绿色的两个方块,分别乘以Wq与Wk(这两个矩阵是随机生成的,里面的参数会随着训练而改变),变成了q与k。q与k就包含了a1与a2本来的信息,他们点乘后变成a.

 a就是注意力分数

         然后a1分别与a2,a3,a4分别相乘。同时a1还要跟自己做关联性计算。即q1要与k2,k3,k4分别进行点乘,获得a12, a13, a14。

 

三、具体数值计算

我们现在搜索“Note Book”,首先按照“Note”、“Book”来搜索。他们在论文中用64位来表示,我们这里简化一下,简化成三位:

首先生成词向量,不知道什么是词向量的可以百度一下,搞懂词向量概念再继续看。

Note   词向量为  [1,0,0,1];这个数值我随便起的,你们可以随意定长度与内部数值。

Book   词向量为  [0,1,1,1]

然后随机生成三个不同的权重矩阵W^{^{Q}},W^{^{K}},W^{^{V}};他们的大小是4*3;里边的数我随机编的。

初始化 X1, X2 , 还有 W^{^{Q}},W^{^{K}},W^{^{V}}

Q,K,V初始化公式如下所示,很简单,看一看就能明白:

Q1 = X1 \times W^{q} ; \ \ \ Q2 = X2 \times W^{q}\\ K1 = X1 \times W^{K} ; \ \ \ K2 = X2 \times W^{K}\\ V1 = X1 \times W^{V} ; \ \ \ V2 = X2 \times W^{V}\\

计算完毕后的如下图所示:

 我们获取到了各个完整的值了,下一步我们要将Q1跟不同的K相乘,得到score,即score=Q*K。

各个计算步骤如下图所示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/39350.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Attention:何为注意力机制?

本文来自公众号“AI大道理” 人类利用有限的注意力资源从大量信息中快速筛选出高价值信息,这是人类在长期进化中形成的一种生存机制,人类视觉注意力机制极大地提高了视觉信息处理的效率与准确性。 attention从注意力模型的命名方式看,借鉴了…

小红书如何营销?各大品牌小红书运营投放营销策划方案合集(13份)

传统企业如何通过短视频进行营销?短视频营销策划方案合集 我是 左木杨,我的营销知识库已经收集了10000品牌营销方案,欢迎全国对营销感兴趣的朋友一起加入进来。 今天为大家精选了13份知名品牌小红书营销策划方案: 涵盖&#xf…

小红书内容营销的必读推荐 小红书运营策划方案上海氖天

小红书内容营销是指以小红书为载体,运用内容开展营销活动,主要包括生产吸引人的内容、分享珍贵的内容、借助小红书各类工具宣传内容、吸引更多用户等。 1,做内容,就是针对某一群体,提供懒人版问题解决方法,…

小红书新媒体运营推广策略

小红书是以美妆、时尚穿搭内容为主的产品种草社区,也是很多年轻人愿意使用的平台,随着更多领域的开放,其他专业领域的博主也是快速入驻,成熟领域的头部账号相对饱和,没有丰富的专业知识储备和别具一格的表现方式最好不…

小红书整体框架及玩法

省时查报告-专业、及时、全面的行研报告库 省时查方案-专业、及时、全面的营销策划方案库 【免费下载】2023年2月份热门报告合集 小红书爆文笔记进阶指南 最新亲测国内可用ChatGPT使用教程(3分钟搞定) 2023全域用户经营白皮书 ChatGPT的发展历程、原理、…

如何实现小红书差异化运营?

时间步入2022下半年,虽然大型营销节点暂时迎来空窗期,但品牌方仍在持续性用户心智种草,不断提升曝光,为新品销售及下一次大促充分准备。 小红书作为年轻群体的生活方式平台和消费决策入口,已经成为品牌广告投放的重要渠…

讯飞星火大模型详细内测体验:看它能否应对这些挑战?

名人说:一花独放不是春,百花齐放花满园。——《增广贤文》 作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊) 目录 一、简要介绍二、分类问题测试0️⃣自我介绍1️⃣语言理解2️⃣知识问答3️⃣逻辑推…

上海移动HG6145D光猫之超级用户登录方法

0.部分资料介绍的超级账号:CMCCAdmin 超级密码:aDm8H%MdA,目前已经失效 。其实在2021年之前是可以用的。 1.获取MAC地址: arp -a 192.168.1.1或 arp -a 注意要和光猫同一网段 2.开启Telnet 浏览器输入http:/192.168.1.1/cgi-bin/telnetenable.cgi?telne…

QHashIterator-官翻

QHashIterator Class template <typename Key, typename T> class QHashIterator QHashIterator 类为 QHash 和 QMultiHash 提供 Java 风格的常量迭代器。更多内容… 头文件:#include qmake:QT core 所有成员列表&#xff0c;包括继承的成员废弃的成员 公共成员函数…

如何让你的网页生成一个像siri一样的语音助手

首先你要知道两个概念语音识别 &#x1f984; 与语音合成 &#x1f432;。 语音识别: 语音识别&#xff08;speech recognition&#xff09;技术&#xff0c;也被称为自动语音识别&#xff08;英语&#xff1a;Automatic Speech Recognition, ASR&#xff09;、电脑语音识别&am…

为什么Siri总是像个智障?智能助手背后的技术到底有多难?

导读&#xff1a;本文带你简单了解一下智能助手背后的会话式人工智能技术。 作者&#xff1a;木羊同学 来源&#xff1a;大数据DT&#xff08;ID&#xff1a;hzdashuju&#xff09; 01 大话智能助理 智能助理应该是当前人工智能技术最为成功的落地方向之一。我还记得&#xff0…

一文把 JavaScript 中的 this 聊得明明白白

文章目录 1.this 是什么&#xff1f;2.this的指向2.1 全局上下文的 this 指向2.2 函数&#xff08;普通函数&#xff09;上下文中的 this 指向2.3 事件处理程序中的 this 指向2.4 以对象的方式调用时 this 的指向2.5 构造函数中的 this 指向2.6 在 类上下文中 this 的指向。2.7…

投递简历用什么邮箱最好用?

春招已经开始了&#xff0c;你却还没明白一个问题&#xff1a;为什么你的简历邮件&#xff0c;没有回音&#xff1f;但也许企业根本没有收到你的邮件。邮件&#xff0c;其实是求职中一门不可缺少的基础课。选什么邮箱&#xff1f;邮件如何命名&#xff1f;简历如何命名&#xf…

程序员如何写简历

【面试】程序员如何写简历 一份好的简历可以在整个申请面试以及面试过程中起到非常重要的作用。 一 简历的重要性 简历就像是我们的门面&#xff0c;是 HR 对我们求职者的第一映像&#xff0c;它在很大程度上决定了是否能够获得面试机会。 网申&#xff1a;简历必然经过 HR 的…

大厂程序员手把手教你如何写简历!!(附简历模板)

本文 https://github.com/youngyangyang04/leetcode-master 已经收录&#xff0c;里面还有leetcode刷题攻略、各个类型经典题目刷题顺序、思维导图&#xff0c;可以fork到自己仓库&#xff0c;有空看一看一定会有所收获&#xff0c;如果对你有帮助也给一个star支持一下吧&#…

程序员如何写一份更好的简历

简历中的常见错误 1. 信息过多&#xff0c;缺乏重点 信息过多的常见表现是十几行的技能列表&#xff0c; 我举一个血淋淋的例子&#xff1a; 20 行的技能列表&#xff0c;这位求职者开始就把自己了解的所有工具都列出来&#xff0c;希望能够突显自己的经验和学习能力&#xf…

邮箱投递简历,如何正确书写正文和主题?

前言 又快到了一年一度的春招和毕业季。身边还有许多准备从事IT行业的朋友没有找到工作&#xff0c;基兄特此整理了一份关于自己找工作的经验&#xff08;也参考了网上的部分数据和内容&#xff09;。 本文的内容主要分为邮箱投递简历&#xff0c;如何正确书写正文和主题&#…

【干货】如何打造HR无法拒绝的简历?测试开发大牛带手把手你写简历!

通过率90%&#xff0c;优秀的软件测试简历长什么样&#xff1f; 也许口才好的人会觉得简历不重要&#xff0c;能说就行了&#xff0c;那是因为你没有体会过石沉大海的感觉&#xff01; 很多人觉得疑惑&#xff0c;为什么我投了那么多简历&#xff0c;都没有接到面试通知&…

chatgpt赋能python:Python获取数据:更高效的数据获取与分析

Python获取数据&#xff1a;更高效的数据获取与分析 Python是一种高级的编程语言&#xff0c;常用于数据分析、机器学习、Web开发等领域。它的简单易学、高效便捷的特点使其成为了许多数据分析工作的首选语言。本文将介绍如何使用Python获取数据并进行分析。 为什么选择Pytho…

chatgpt赋能python:Python预处理:提高数据分析效率的重要一步

Python预处理&#xff1a;提高数据分析效率的重要一步 在数据分析的过程中&#xff0c;数据预处理是不可避免的一步&#xff0c;能否有效地进行数据预处理&#xff0c;对于后续的数据分析效率以及结果的准确性至关重要。Python作为一种先进的编程语言&#xff0c;不仅在数据分…