【外文原版书阅读】《机器学习前置知识》2.用看电影推荐的例子带你深入了解向量点积在机器学习的作用

目录

3.3 Where Are You Looking, Vector? The Dot Product


个人主页:Icomi

大家好,我是Icomi,本专栏是我阅读外文原版书《Before Machine Learning》对于文章中我认为能够增进线性代数与机器学习之间的理解的内容的一个输出,希望能够帮助到各位更加深刻的理解线性代数与机器学习。若各位对本系列内容感兴趣,可以给我点个关注跟进内容,我将持续更新。

本专栏与我的《PyTorch入门》结合将理解更深刻。

专栏地址:PyTorch入门

3.3 Where Are You Looking, Vector? The Dot Product

1.One way that we can multiply vectors is called the dot product, which we will cover now. The other is called the cross product, which won’t be covered in this book.

我们可以将向量相乘的一种方法称为点积,我们现在将介绍它。另一个称为叉积,本书不会涉及。点积和叉积之间的主要区别在于结果:点积结果是一个标量,来自叉积的是另一个向量。

2.A true understanding of linear algebra becomes more accessible with visualisations, and the dot product has a tremendous geometrical interpretation. It can be calculated by projecting the vector into and multiplying the magnitude of this projection with the length of , or vice versa. In other words, the dot product will represent how much of points in the same direction as . Let’s verify this; so, given the vectors and , a projection of into $\vec{v}$ can be represented this way:

通过可视化,对线性代数的真正理解变得更加容易,并且点积具有极强的几何解释能力。可以通过将向量投影到 并将此投影的大小乘以 的长度来计算,反之亦然。换句话说,点积将表示 指向与 相同的方向的多少。让我们验证一下;因此,给定向量 的投影可以这样表示:

3.Projections are a fundamental concept in machine learning, particularly in understanding how data can be represented in lowerdimensional spaces. They can be intuitively understood by considering angles and movement in the context of vectors.

投影是机器学习中的一个基本概念,尤其是在理解如何在低维空间中表示数据时。通过在向量的上下文中考虑角度和运动,可以直观地理解它们。

Q:投影有哪一些运用场景呢?

如下:
  • 数据降维:在处理高维数据时,如大量特征的图像数据或文本数据,使用主成分分析(PCA)等方法,通过将高维数据投影到低维空间,去除数据中的冗余信息,保留最重要的特征,使得数据更易于处理和分析,同时也能减少计算量,提高模型训练效率。例如,在对海量的卫星图像数据进行分析时,通过投影降维可以快速提取出关键的地理特征信息。
  • 特征提取:在自然语言处理中,词向量模型如 Word2Vec 会将文本中的词汇投影到低维向量空间,从而捕捉词汇之间的语义关系。这些投影后的向量可以作为机器学习模型的输入特征,用于文本分类、情感分析等任务。比如在影评的情感分析中,通过将影评中的词汇投影为向量,模型可以更好地理解文本的情感倾向。
  • 图像识别:在图像识别任务里,将图像的像素数据投影到特定的特征空间,例如使用卷积神经网络(CNN)中的卷积层和池化层操作,可将图像投影到不同的特征维度上,提取图像的边缘、纹理等关键特征,用于图像的分类、目标检测等。像在人脸识别系统中,就是通过对人脸图像进行投影特征提取来识别不同的人脸。
  • 异常检测:在对网络流量数据或工业生产数据进行监测时,通过将数据投影到特定的空间中,建立正常数据的分布模型,当有数据点的投影偏离正常分布范围时,就可能被判定为异常数据。例如在电力系统中,对电网的运行数据进行投影分析,可及时发现电网中的异常波动,保障电网安全运行。

4.

(1)点积为正,表示两个向量指向同一个方向。

(2) 点积为 0,表示两个向量垂直,角度为 90 度。

(3)点积是负,这意味着向量指向不同的方向。

5.This may still be a bit abstract—norms, vectors, and how they
align with each other’s directions, so let’s explore an example. Imag-
ine we are running a streaming service where movies are represented
by 2-dimensional vectors. Although this is a simplified representa-
tion, it helps us understand the applications of the dot product. In
our model, each entry of our vectors represents two genres: drama
and comedy. The higher the value of an entry, the more character-
istics of that genre the movie has

这可能仍然有点抽象 —— 规范、向量,以及它们如何与彼此的方向保持一致,所以让我们探索一个例子。想象一下,我们正在运行一个流媒体服务,其中电影由二维向量表示。虽然这是一个简化的表示,但它有助于我们理解点积的应用。在我们的模型中,我们向量的每个条目代表两种类型:戏剧和喜剧。条目的值越高,电影具有的该类型的特征就越多

6.通过一个电影推荐的案例来理解点积对于机器学习的作用:

 Our task is to recommend a movie to a user, let’s call her Susan.
We know that Susan has watched movie − , represented by

In our library, we have two more movies that we could recommend to Susan, movies $\vec{b}$ and Let’s visualize these movie vectors :

我们的任务是向用户推荐一部电影,让我们称她为Susan。我们知道Susan看过电影,代表为:

在我们的图书馆里,我们还有两部电影可以推荐给苏珊,电影
让我们想象这些电影矢量:

7.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/10191.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

论文阅读(八):结构方程模型用于研究数量遗传学中的因果表型网络

1.论文链接:Structural Equation Models for Studying Causal Phenotype Networks in Quantitative Genetics 摘要: 表型性状可能在它们之间发挥因果作用。例如,农业物种的高产可能会增加某些疾病的易感性,相反,疾病的…

每日一题——序列化二叉树

序列化二叉树 BM39 序列化二叉树题目描述序列化反序列化 示例示例1示例2 解题思路序列化过程反序列化过程 代码实现代码说明复杂度分析总结 BM39 序列化二叉树 题目描述 请实现两个函数,分别用来序列化和反序列化二叉树。二叉树的序列化是将二叉树按照某种遍历方式…

JVM_程序计数器的作用、特点、线程私有、本地方法的概述

①. 程序计数器 ①. 作用 (是用来存储指向下一条指令的地址,也即将要执行的指令代码。由执行引擎读取下一条指令) ②. 特点(是线程私有的 、不会存在内存溢出) ③. 注意:在物理上实现程序计数器是在寄存器实现的,整个cpu中最快的一个执行单元 ④. 它是唯一一个在java虚拟机规…

Attention--人工智能领域的核心技术

1. Attention 的全称与基本概念 在人工智能(Artificial Intelligence,AI)领域,Attention 机制的全称是 Attention Mechanism(注意力机制)。它是一种能够动态分配计算资源,使模型在处理输入数据…

机器学习2 (笔记)(朴素贝叶斯,集成学习,KNN和matlab运用)

朴素贝叶斯模型 贝叶斯定理: 常见类型 算法流程 优缺点 集成学习算法 基本原理 常见方法 KNN(聚类模型) 算法性质: 核心原理: 算法流程 优缺点 matlab中的运用 朴素贝叶斯模型 朴素贝叶斯模型是基于贝叶斯…

智慧园区系统助力企业智能化升级实现管理效率与安全性全方位提升

内容概要 在当今数字化转型的浪潮中,企业面临着前所未有的挑战和机遇。智慧园区系统作为一种创新性解决方案,正在快速崛起,帮助企业实现全面的智能化升级。这套系统不仅仅是一个简单的软件工具,而是一个强大的综合管理平台&#…

【视频+图文详解】HTML基础4-html标签的基本使用

图文教程 html标签的基本使用 无序列表 作用&#xff1a;定义一个没有顺序的列表结构 由两个标签组成&#xff1a;<ul>以及<li>&#xff08;两个标签都属于容器级标签&#xff0c;其中ul只能嵌套li标签&#xff0c;但li标签能嵌套任何标签&#xff0c;甚至ul标…

电子电气架构 --- 在智能座舱基础上定义人机交互

我是穿拖鞋的汉子&#xff0c;魔都中坚持长期主义的汽车电子工程师。 老规矩&#xff0c;分享一段喜欢的文字&#xff0c;避免自己成为高知识低文化的工程师&#xff1a; 简单&#xff0c;单纯&#xff0c;喜欢独处&#xff0c;独来独往&#xff0c;不易合同频过着接地气的生活…

SAP SD学习笔记27 - 请求计划(开票计划)之1 - 定期请求

上两章讲了贩卖契约&#xff08;框架协议&#xff09;的概要&#xff0c;以及贩卖契约中最为常用的 基本契约 - 数量契约和金额契约。 SAP SD学习笔记26 - 贩卖契约(框架协议)的概要&#xff0c;基本契约 - 数量契约_sap 框架协议-CSDN博客 SAP SD学习笔记27 - 贩卖契约(框架…

Ansible自动化运维实战--fetch、cron和group模块(5/8)

文章目录 一、fetch 模块1.1、功能1.2、常用参数1.3、测试1.4、注意事项 二、cron 模块2.1、功能2.2、常用参数2.3、注意事项 三、group模块3.1、功能3.2、常用参数3.3、例子3.4、注意事项 一、fetch 模块 1.1、功能 fetch 模块的主要功能是将远程主机上的文件复制到本地控制…

C++中常用的十大排序方法之1——冒泡排序

成长路上不孤单&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a; 【&#x1f60a;///计算机爱好者&#x1f60a;///持续分享所学&#x1f60a;///如有需要欢迎收藏转发///&#x1f60a;】 今日分享关于C中常用的排序方法之——冒泡排序的相关…

商密测评题库详解:商用密码应用安全性评估从业人员考核题库详细解析(8)

1. 重要领域网络和信息系统的范畴 题目 根据《商用密码应用安全性评估管理办法(试行)》,下列哪些属于重要领域网络和信息系统( )。 A. 基础信息网络 B. 面向社会服务的政务信息系统 C. 重要工业控制系统 D. 以上都是 答案 D 答案解析 依据《商用密码应用安全性评…

openssl 生成证书 windows导入证书

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…

SpringBoot整合Swagger UI 用于提供接口可视化界面

目录 一、引入相关依赖 二、添加配置文件 三、测试 四、Swagger 相关注解 一、引入相关依赖 图像化依赖 Swagger UI 用于提供可视化界面&#xff1a; <dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger-ui</artifactI…

Nuxt:利用public-ip这个npm包来获取公网IP

目录 一、安装public-ip包1.在Vue组件中使用2.在Nuxt.js插件中使用public-ip 一、安装public-ip包 npm install public-ip1.在Vue组件中使用 你可以在Nuxt.js的任意组件或者插件中使用public-ip来获取公网IP。下面是在一个Vue组件中如何使用它的例子&#xff1a; <template…

QT串口通信,实现单个温湿度传感器数据的采集

1、硬件设备 RS485中继器(一进二出),usb转485模块、电源等等 => 累计115元左右。 2、核心代码 #include "MainWindow.h" #include "ui_MainWindow.h"MainWindow::

【深度分析】DeepSeek 遭暴力破解,攻击 IP 均来自美国,造成影响有多大?有哪些好的防御措施?

技术铁幕下的暗战&#xff1a;当算力博弈演变为代码战争 一场针对中国AI独角兽的全球首例国家级密码爆破&#xff0c;揭开了数字时代技术博弈的残酷真相。DeepSeek服务器日志中持续跳动的美国IP地址&#xff0c;不仅是网络攻击的地理坐标&#xff0c;更是技术霸权对新兴挑战者的…

【漫话机器学习系列】068.网格搜索(GridSearch)

网格搜索&#xff08;Grid Search&#xff09; 网格搜索&#xff08;Grid Search&#xff09;是一种用于优化机器学习模型超参数的技术。它通过系统地遍历给定的参数组合&#xff0c;找出使模型性能达到最优的参数配置。 网格搜索的核心思想 定义参数网格 创建一个包含超参数值…

Transformer+vit原理分析

目录 一、Transformer的核心思想 1. 自注意力机制&#xff08;Self-Attention&#xff09; 2. 多头注意力&#xff08;Multi-Head Attention&#xff09; 二、Transformer的架构 1. 整体结构 2. 编码器层&#xff08;Encoder Layer&#xff09; 3. 解码器层&#xff08;Decoder…

【MySQL】MySQL客户端连接用 localhost和127.0.0.1的区别

# systemctl status mysqld # ss -tan | grep 3306 # mysql -V localhost与127.0.0.1的区别是什么&#xff1f; 相信有人会说是本地IP&#xff0c;曾有人说&#xff0c;用127.0.0.1比localhost好&#xff0c;可以减少一次解析。 看来这个入门问题还有人不清楚&#xff0c;其实…