机器学习数学基础

机器学习基础

    • 1、标量、向量、矩阵、张量
    • 2、概率函数、概率分布、概率密度、分布函数
    • 3、向量的线性相关性
    • 4、最大似然估计
    • 5、正态分布(高斯分布)
    • 6、向量的外积(叉积)
    • 7、向量的内积(点积)
    • 8、超平面(Hyperplane)
    • 9、广义线性模型(GLM)
    • 10、伯努利分布与二项分布
    • 11、凸函数
    • 12、向量的相似性度量



1、标量、向量、矩阵、张量


标量、向量、矩阵和张量是线性代数中不同维度的数学对象,它们之间的区别在于维数和结构:

  • 标量(Scalar):标量是一个数值,只有大小,没有方向。例如物理学中的时间、质量、温度等

  • 向量(Vector):向量也称为欧几里得向量、几何向量、矢量,向量指既有大小又有方向的量。向量可以形象化地表示为带箭头的线段,箭头所指的方向代表向量的方向,线段的长度代表向量的大小。向量有四种表示方式:代数表示(字母加箭头)、几何表示(平行四边形法则)、坐标表示((x,y,z))和矩阵表示([x y z]T

  • 矩阵(Matrix):矩阵是按照方阵排成m行n列的数值集合。简单来说,矩阵是一个二维数组,由行和列组成,每行和每列都是一个向量。矩阵中的每个元素都有自己的行索引和列索引,它可以用来表示线性变换、方程组或数据表

  • 张量(Tensor):张量源于力学,张量是多维数组,目的是把向量、矩阵推向更高的维度。张量是一种泛化的多维数组概念,它可以是任何维度(秩)的,例如向量(矢量)是一阶张量,矩阵是二阶张量,高于二维的称为三阶张量、四阶张量等

总的来说,标量是最简单的数据形式,而向量、矩阵和更高维度的张量则是复杂度逐渐增加的多维数据结构,它们在现代科学和技术的许多领域中都扮演着重要角色

2、概率函数、概率分布、概率密度、分布函数


研究一个随机变量,不只是要看它能取哪些值,更重要的是它取各种值的概率如何!概率函数、概率分布、概率密度、分布函数,都是在描述概率

1)概率函数

概率函数使用函数的形式来表达概率 P i = P ( X = x i ) ( i = 1 , 2 , 3 , . . . ) P_i=P(X=x_i) \quad (i=1,2,3,...) Pi=P(X=xi)(i=1,2,3,...)

例如, P ( X P(X P(X= 1 ) = 1 / 6 1)=1/6 1)=1/6,这个概率函数表示当随机变量取值为1的概率为1/6。概率函数一次只能表示一个随机变量取值的概率

2)概率分布

概率分布是离散型随机变量和每个随机变量对应的概率:

X x 1 x_1 x1 x 2 x_2 x2 x 3 x_3 x3 x n x_n xn
P i P_i Pi P 1 P_1 P1 P 2 P_2 P2 P 3 P_3 P3 P n P_n Pn

这样的列表被叫做离散型随机变量的概率分布。具体就是离散型随机变量的值与这个取值的概率分布列表

对于连续型随机变量,概率分布被叫作概率密度

3)分布函数

对于离散型随机变量,分布函数称为概率分布函数,是指将某一点的概率与该点前面所有概率的累加,又称累积概率函数 F ( X ) = P ( X ≤ x i ) = ∑ 1 i P i F(X)=P(X≤x_i)=\sum_1^iP_i F(X)=P(Xxi)=1iPi

分布函数是一个永不递减的函数,最右边即为最大值1,最左边为最小值0

对于连续型随机变量,分布函数称为概率密度函数,它就是概率密度从负无穷到当前随机变量值的定积分(面积)
F ( X ) = ∫ − ∞ X f ( x ) d x F(X)=\int_{-\infty}^Xf(x)dx F(X)=Xf(x)dx

在这里插入图片描述

如图所示,左图表示 F ( x ) F(x) F(x)是连续型随机变量的概率密度,右图表示 f ( x ) f(x) f(x)是连续型随机变量的概率密度函数,它们之间的关系是:概率密度函数是概率密度的导函数

需要注意的是,概率密度函数在某点取值的几何意义表示概率密度函数在该点的变化率(导数),而不是概率值

3、向量的线性相关性


所有分量为实数的n维向量构成的集合, 称为一个n维向量空间,向量空间又称线性空间

对于n维向量 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am,如果存在不全为0的数使得
k 1 a 1 + k 2 a 2 + . . . + k m a m = 0 k_1a_1+k_2a_2+...+k_ma_m=0 k1a1+k2a2+...+kmam=0

则称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am是线性相关的,否则,称向量组 a 1 , a 2 , . . . a m a_1,a_2,...a_m a1,a2,...am线性无关

例如,对于向量 a 1 , a 2 , a 3 a_1,a_2,a_3 a1,a2,a3,若它们之间满足
a ⃗ 3 = − 1 2 a ⃗ 1 + 2 3 a ⃗ 2 \vec a_3 = -\frac{1}{2}\vec a_1+\frac{2}{3}\vec a_2 a 3=21a 1+32a 2

即向量 a 3 a_3 a3可以用向量 a 1 a_1 a1 a 2 a_2 a2线性表示,说明 a 1 , a 2 , a 3 a_1,a_2,a_3 a1,a2,a3这三个向量是线性相关的

4、最大似然估计


最大似然估计的原理详解及推导见文章:传送门

5、正态分布(高斯分布)


正态分布(高斯分布)的介绍详见文章:传送门

6、向量的外积(叉积)


向量的叉乘(叉积),也叫向量的外积、向量积。在二维空间中,对于两个向量 a ⃗ = ( x 1 , y 1 ) \vec a=(x_1,y_1) a =(x1,y1) b ⃗ = ( x 2 , y 2 ) \vec b=(x_2,y_2) b =(x2,y2),定义它们的向量积为以下向量:
a ⃗ × b ⃗ = ∣ i ⃗ j ⃗ x 1 y 1 x 2 y 2 ∣ = x 1 y 2 i ⃗ − y 1 x 2 j ⃗ \vec a \times \vec b= \begin{vmatrix} \vec i&\vec j\\ x_1&y_1\\ x_2&y_2 \end{vmatrix} = x_1y_2 \vec i-y_1x_2 \vec j a ×b = i x1x2j y1y2 =x1y2i y1x2j

对于行列数相同的两个向量,叉积运算就是对这两个向量对角位相乘后求差的操作,叉积的结果是一个向量

在二维空间中,叉乘的几何意义是:叉乘的结果表示由向量 a ⃗ \vec a a 和向量 b ⃗ \vec b b 所构成的平行四边形的面积

在这里插入图片描述


a ⃗ × b ⃗ = ∣ a ⃗ ∣ ∣ b ⃗ ∣ sin ⁡ θ \vec a \times \vec b=|\vec a||\vec b|\sin\theta a ×b =a ∣∣b sinθ

在三维空间中,对于两个向量 a ⃗ = ( x 1 , y 1 , z 1 ) \vec a=(x_1,y_1,z_1) a =(x1,y1,z1) b ⃗ = ( x 2 , y 2 , z 2 ) \vec b=(x_2,y_2,z_2) b =(x2,y2,z2),定义它们的向量积为以下向量:
a ⃗ × b ⃗ = ∣ i ⃗ j ⃗ k ⃗ x 1 y 1 z 1 x 2 y 2 z 2 ∣ = ( y 1 z 2 − y 2 z 1 ) i ⃗ − ( x 1 z 2 − x 2 z 1 ) j ⃗ + ( x 1 y 2 − x 2 y 1 ) k ⃗ \vec a \times \vec b= \begin{vmatrix} \vec i&\vec j&\vec k\\ x_1&y_1&z_1\\ x_2&y_2&z_2 \end{vmatrix} = (y_1z_2-y_2z_1)\vec i-(x_1z_2-x_2z_1)\vec j+(x_1y_2-x_2y_1)\vec k a ×b =

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/253734.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java基于微信小程序的驾校报名小程序,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

SERVLET过滤器

SERVLET过滤器 全球因特网用户使用不同类型的Web浏览器访问应用服务器上存储的Web应用程序。每个浏览器根据对应的Web浏览器窗口中的设置显示应用程序中的信息。Web应用程序可能会有一些客户机的Web浏览器不支持的HTML标记或功能。这种情况下,应用程序在客户机的Web浏览器中可…

notepad++成功安装后默认显示英文怎么设置中文界面?

前几天使用电脑华为管家清理电脑后,发现一直使用的notepad软件变回了英文界面,跟刚成功安装的时候一样,那么应该怎么设置为中文界面呢?具体操作如下: 1、打开notepad软件,点击菜单栏“Settings – Prefere…

探索C语言中的联合体与枚举:数据多面手的完美组合!

​ ✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:C语言学习 贝蒂的主页:Betty‘s blog 1. 联合体的定义 联合体又叫共用体,它是一种特殊的数据类型&…

vue项目打包部署到flask等后端服务里面,实现前后端不分离部署,解决空白页面和刷新页面not fount问题

1. 编译模式一定要设置为esnext,否则会报错: Strict MIME type checking is enforced for module scripts per HTML spec.Expected a JavaScript module script but the server responded with a MIME type of "text/plain". 具体解释可以看vi…

机器学习中常用的性能度量—— ROC 和 AUC

什么是泛化能力? 通常我们用泛化能力来评判一个模型的好坏,通俗的说,泛化能力是指一个机器学期算法对新样本(即模型没有见过的样本)的举一反三的能力,也就是学以致用的能力。 举个例子,高三的…

删除和清空Hive外部表数据

外部表和内部表区别 未被external修饰的是内部表(managed table),被external修饰的为外部表(external table); 区别: 内部表数据由Hive自身管理,外部表数据由HDFS管理; …

Rebuild企业管理系统 SSRF漏洞(CVE-2024-1021)

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

【人工智能】人工智能 – 引领未来科技的潮流

写在前面 引言红利挑战结论 引言 人工智能是指使计算机系统表现出类似于人类智能的能力。其目标是实现机器具备感知、理解、学习、推理和决策等智能行为。人工智能的发展可以追溯到上世纪50年代,随着计算机技术和算法的不断进步,人工智能得以实现。 今天…

Pymysql之Connection中常用API

Connection中常用API 1、open() :检测数据库是否连接。 connect.open:如果数据库连接返回Trhe,否则返回False。 2、ping(reconnectTrue) connect.ping(reconnectTrue):如果reconnectTrue表示连接断开后,重新进行连接。 import…

移动云ONAIR媒体云全解读!媒体内容数字化融合一站式解决方案

当下,传统媒体面临着诸多挑战,如何利用信息技术提升内容的质量、形式和分发效率,成为媒体行业的迫切需求。移动云作为数字中国建设的“主力军”, 立足于新兴媒体与云计算市场的变化与需求,推出了ONAIR 媒体云解决方案&…

【FPGA】高云FPGA之IP核的使用->PLL锁相环

FPGA开发流程 1、设计定义2、设计输入3、分析和综合4、功能仿真5、布局布线6、时序仿真7、IO分配以及配置文件(bit流文件)的生成8、配置(烧录)FPGA9、在线调试 1、设计定义 使用高云内置IP核实现多路不同时钟输出 输入时钟50M由晶…

postman执行批量测试

1.背景 有许多的人常常需要使用第三方系统进行重复的数据查询,本文介绍使用PostMan的方式对数据进行批量的查询,减少重复的劳动。 2.工具下载 3.初入门 一、如图示进行点击,创建collection 二、输入对应的名称 三、创建Request并进行查…

Tomcat之虚拟主机

1.创建存放网页的目录 mkdir -p /web/{a,b} 2.添加jsp文件 vi /web/a/index.jsp <% page language"java" import"java.util.*" pageEncoding"UTF-8"%> <html> <head><title>JSP a page</title> </head> …

音视频色彩:RGB/YUV

目录 1.RGB 1.1介绍 1.2分类 1.2.1RGB16 1)RGB565 2)RGB555 1.2.2RGB24 1.2.3RGB222 2.YUV 2.1介绍 2.2分类 2.2.1 YUV444 2.2.2 YUV 422 2.2.3 YUV 420 2.3存储格式 2.3.1 YUYV 2.3.2 UYVY 2.3.3 YUV 422P 2.3.4 YUV420P/YUV420SP 2.3.5 YU12 和…

每日一题——LeetCode1422.分割字符串的最大得分

方法一 暴力枚举 枚举所有分割点的情况&#xff0c;取最大得分 var maxScore function(s) {let res 0;const n s.length;for (let i 1; i < n; i) {let score 0;for (let j 0; j < i; j) {if (s[j] 0) {score;}}for (let j i; j < n; j) {if (s[j] 1) {sco…

druid配置wall导致无法批量sql

1、现象 2、原配置 spring:autoconfigure:exclude: com.alibaba.druid.spring.boot.autoconfigure.DruidDataSourceAutoConfiguredatasource:druid:stat-view-servlet:enabled: trueloginUsername: ***loginPassword: ***allow:web-stat-filter:enabled: truefilter:wall:conf…

案例分享:频域与时域仿真的区别

从信号与系统理论中,可以知道,对于占空比为50%的周期信号,只含有奇次谐波,实际中,时钟信号并不是理想的占空比为50%的梯形波,因此,会同时含有奇偶次谐波,一个典型的案例,DDR仿真中,如果用模拟的理想激励源,如下图所示,可以发现,频谱中只会存在基频及其奇次谐波。 …

微软.NET6开发的C#特性——接口和属性

我是荔园微风&#xff0c;作为一名在IT界整整25年的老兵&#xff0c;看到不少初学者在学习编程语言的过程中如此的痛苦&#xff0c;我决定做点什么&#xff0c;下面我就重点讲讲微软.NET6开发人员需要知道的C#特性&#xff0c;然后比较其他各种语言进行认识。 C#经历了多年发展…

【lesson47】进程通信之system V(共享内存)补充知识

文章目录 补充知识 补充知识 进行通信的key值问题&#xff0c;进程要通信的对方进程怎么能保证对方能看到&#xff0c;并且看到的就是该进程创建的共享内存的。 所以就通过key值来标识共享内存&#xff0c;key值是几不重要&#xff0c;只要在系统里是唯一的即可。 这样server和…