[吃瓜教程]概览西瓜书+南瓜书第3章线性回归

第三章 线性模型

3.0 机器学习三要素

  1. 模型:根据问题,确定假设空间
  2. 策略:根据评价标准,确定选取最优模型的策略(通常会产出一个损失函数)
  3. 算法:求解损失函数,确定最优模型。

3.1基本形式

线性模型(linear model):试图学得一个通过属性的线性组合来进行预测的函数。
形式:
f ( x ) = w 1 x 1 + w 2 x 2 + . . . + w d x d + b f(x)=w_1x_1+w_2x_2+...+w_dx_d+b f(x)=w1x1+w2x2+...+wdxd+b
向量表示:
f ( x ) = w T x + b f(x)=w^Tx+b f(x)=wTx+b
其中, w = ( w 1 ; w 2 ; . . . w d ) w=(w_1;w_2;...w_d) w=(w1;w2;...wd)
优势: 形式简单,易于建模,通过引入层级结构或高纬映射可得到非线性模型,可解释性强。
分类: 简单线性回归,多元线性回归。

3.2 线性回归

3.2.1模型

回归: 假设现在有一批数据点,我们用一条直线/曲线对这些点进行拟合,这个拟合过程就称为回归。
线性回归: 线性回归假设因变量 𝑌与自变量 𝑋之间存在线性关系。
一元线性回归: 在一元线性回归中,我们假设因变量 𝑌和自变量 𝑋之间存在一个线性关系,该关系可以用以下方程表示:

Y = β 0 + β 1 X + ϵ Y=\beta_0+\beta_1X+ϵ Y=β0+β1X+ϵ

其中:

  • 𝑌是因变量(目标变量)
  • 𝑋是自变量(预测变量)
  • β 0 \beta_0 β0是截距(intercept),表示当自变量 X=0 时因变量 Y 的预期值。
  • β 1 \beta_1 β1是斜率(slope),表示自变量每增加一个单位,因变量的预期变化量。
  • 𝜖是误差项(error term),表示模型无法解释的随机噪声。

多元线性回归: 在多元线性回归中,我们假设因变量 𝑌和多个自变量 X 1 , X 2 , . . . , X p X_1,X_2,...,X_p X1,X2,...,Xp之间存在一个线性关系,该关系可以用以下方程表示:
Y = β 0 + β 1 X 1 + β 2 X 2 + . . . + β p X p + ϵ Y=\beta_0+\beta_1X_1+\beta_2X_2+...+\beta_pX_p+\epsilon Y=β0+β1X1+β2X2+...+βpXp+ϵ
其中:

  • Y是因变量
  • X 1 , X 2 , X 3 X_1,X_2,X_3 X1,X2,X3是自变量
  • β 0 \beta_0 β0是截距(intercept),表示当所有自变量 均为0时因变量 Y 的预期值。
  • β 1 , β 2 , . . . , β p \beta_1,\beta_2,...,\beta_p β1β2...,βp是回归系数,表示每个自变量对因变量的影响程度。
  • 𝜖是误差项(error term),表示模型无法解释的随机噪声。
3.2.2策略

在确定了问题的假设空间是线性空间后,我们就面临如何选取最优模型的策略,在目前的情况下就是去确定模型的参数。
最小二乘法: 最小二乘法(Least Squares Method, LSM)是一种统计方法,用于在数据拟合过程中找到最佳拟合函数,使得观测数据与拟合函数之间的误差平方和最小。广泛应用于回归分析中,用来估计模型参数
极大似然估计法: 极大似然估计法(Maximum Likelihood Estimation, MLE)是一种用于估计统计模型参数的方法。其基本思想是通过最大化观测数据的似然函数,找到最有可能产生这些观测数据的参数值。
通过西瓜书和南瓜书的推导可以发现这两种方法是殊途同归的,最终得到如下所示的损失函数:
a r g m i n ( w , b ) ∑ i = 1 m ( y i − w x i − b ) 2 argmin_{(w,b)}\sum_{i=1}^m(y_i-wx_i-b)^2 argmin(w,b)i=1m(yiwxib)2

3.2.3求解w和b

基本的推导思路:

  1. 证明 E ( w , b ) = ∑ i = 1 m ( y i − w x i − b ) 2 E_(w,b)=\sum_{i=1}^m(y_i-wx_i-b)^2 E(w,b)=i=1m(yiwxib)2是关于w和b的凸函数
  2. 用凸函数求最值的思路解出w和b。

在证明某个函数是凸函数之前先了解以下一些概念。
凸集: 设集合 D ⊂ R n D\subset \mathbb {R}^n DRn,如果对任意的 x , y ∈ D x,y\in D x,yD与任意的 α ∈ [ 0 , 1 ] \alpha \in [0,1] α[0,1],有
α x + ( 1 − α ) y ∈ D \alpha x+(1-\alpha)y \in D αx+(1α)yD
则称集合D是凸集。

几何意义:若两个点属于此集合,则这两点连线上的任意一点均属于此集合。如下图所示就是个凸集。
在这里插入图片描述
凸函数: 设D是非空凸集,f是定义在D上的函数,如果对任意的 x 1 x^{1} x1, x 2 x^{2} x2 ∈ D \in D D, α ∈ ( 0 , 1 ) \alpha \in (0,1) α(0,1),均有
f ( α x 1 + ( 1 − α ) x 2 ) ≤ α f ( x 1 ) + ( 1 − α ) f ( x 2 ) f(\alpha x^1+(1-\alpha)x^2)\leq\alpha f(x^1)+(1-\alpha)f (x^2) f(αx1+(1α)x2)αf(x1)+(1α)f(x2)
则称 f f f为D上的凸函数。如下图所示是一个典型的凸函数。
在这里插入图片描述
半正定矩阵:
定义:一个对称矩阵 A被称为半正定矩阵,当且仅当对于所有非零向量 𝑥,有 x T A x ≥ 0 x^TAx\geq 0 xTAx0换句话说,矩阵 𝐴的所有特征值都非负。

判定定理之一:若实对称矩阵的所有顺序主子式均为非负,则该矩阵为半正定矩阵。

**海塞矩阵:**对于一个标量值得多元函数 f ( x 1 , x 2 , . . . x n ) f(x_1,x_2,...x_n) f(x1,x2,...xn),海塞矩阵是由该函数得所有二阶偏导数组成得对称矩阵。海塞矩阵H的元素定义为:
H i j = ∂ 2 f ∂ x i 2 ∂ x j 2 H_{ij}=\frac{\partial^2 f}{\partial x_i^2\partial x_j^2} Hij=xi2xj22f
其中i,j=1,2,…,n。
海塞矩阵的形式化定义:
在这里插入图片描述

关键定理: D ⊂ R n D\subset \mathbb {R}^n DRn是非空开凸集, f : D ⊂ R n → R f:D \subset\mathbb {R}^n →\mathbb {R} f:DRnR,且f(x)在D上二阶连续可微,如果f(x)的Hessian(海塞)矩阵在D上是半正定的,则f(x)是D上的凸函数。

因此通过求损失函数的海塞矩阵是否为半正定的即可证明该损失函数为凸函数,然后即可用凸函数求最值的思路解出w和b。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/357082.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis进阶 - 朝生暮死之Redis过期策略

概述 Redis 是一种常用的内存数据库,其所有的数据结构都可以设置过期时间,时间一到,就会自动删除。你可以想象 Redis 内部有一个死神,时刻盯着所有设置了过期时间的 key,寿命一到就会立即收割。 你还可以进一步站在死神…

“打造智能售货机系统,基于ruoyi微服务版本开源项目“

目录 # 开篇 售货机术语 1. 表设计说明 2. 页面展示 2.1 区域管理页面 2.2 合作商管理页面 2.3 点位管理页面 3. 建表资源 3.1 创建表的 SQL 语句(包含字段备注) 1. Region 表 2. Node 表 3. Partner 表 4. 创建 tb_vending_machine 表的 S…

Netty 入门实例

文章目录 1. 概述2. 代码实例2.1 服务端2.2 客户端2.3 运行截图 3. 整体结构4. 重要组件4.1 EventLoopGroup、EventLoop4.2 Handler & Pipeline4.3 ByteBuf 参考文献 1. 概述 Netty 是一款用于高效开发网络应用的 NIO 网络框架,它大大简化了网络应用的开发过程…

【鸿蒙】创建第⼀个鸿蒙项⽬

点击 Create Project 配置项目 开发工具界面 工程介绍

C语言第17篇:预处理详解

1、预定义符号 C语言设置了一些预定义符号,可以直接使用。预定义符号也是在预处理期间处理的。 __FILE__ //进行编译的源文件 __LINE__ //文件当前的行号 __DATE__ //文件被编译的日期 __TIME__ //文件被编译的时间 __STDC__ //如果编译器遵循ANSI…

[巨详细]使用HBuilder-X新建uniapp项目教程

文章目录 安装HBuilder-X启动uniapp项目其他:下载预览浏览器下载终端插件想用uni-ui 安装HBuilder-X 详细步骤可看上文》》 启动uniapp项目 先打开HBuilder-X 点击新建项目 选择uniapp侧边栏,mian中的点击浏览 选择已经安装到本地的uniapp项目&#…

常用的设计模式

常用设计模式 ①单例模式(始终使用同一个对象)饿汉式/懒汉式DCL. synchronized. volatile(多线程可见性,不保原子性禁止指令重排) ②原型模式:(深拷贝和浅拷贝)使用深拷贝创建对象&#xff08…

本科生大厂算法岗实习经验复盘:从投递到面试的底层思维!

目录 投递渠道boss直聘官网邮箱内推 面试准备leetcode八股深挖项目自我介绍mock面试技巧答不出来怎么办coding反问 复盘技术交流群用通俗易懂方式讲解系列 节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面…

2021-03-29:加密与解密

前段时间导师分配的任务主要是看《加密与解密》这本书,“书本写的很详细,认真看会看懂的!” 是的啊,书本写的很详细,可是作为一个没基础的小白看起来还是挺吃力的,概念一个接一个的出现,虽然看…

【Gradio】表格数据科学与图表-连接到数据库

简介 本指南解释了如何使用 Gradio 将您的应用程序连接到数据库。我们将连接到托管在 AWS 上的 PostgreSQL 数据库,但 gradio 对您连接到的数据库类型及其托管位置完全不可知。因此,只要您能够编写 Python 代码来连接到您的数据,您就可以使用…

无需安装就能一键部署Stable Diffusion 3?

一键部署使用SD3?让你的创作更加便捷! 前言 厚德云上架SD3! 距离Stable Diffusion 3的上线已经有一阵时间了。从上线至今SD3也是一直好评不断,各项性能的提升也让它荣获“最强开源新模型”的称号。成为了AI绘画设计师们新的香馍馍。 可对于SD…

K8S -理解StatefulSet - 部署有状态应用

什么是 有状态服务和 无状态服务 有状态服务(Stateful Service): 有状态服务是指在处理请求期间维护和跟踪用户状态或会话信息的服务。这意味着服务在多个请求之间保持状态,并且需要在请求之间共享和使用这些状态信息。通常&…

Vue67-Vuex简介

因为vuex是插件,所以,使用的时候:vue.use(插件名) 一、Vuex的意义和使用场景 红色的箭头,都是读数据。 若是,B、C、D都想修改A组件中的x数据(写):此时,A组件就是数据的接…

iOS18新增通话录音和应用锁!附升级教程及内置壁纸

一觉睡醒,iOS18终于是揭开面纱了,而且已经有测试版给开发者使用了。 不过还是建议咱们普通用户不要轻易尝试,而且在升级之前一定要用iMazing做个备份,以免测试系统出现问题,丢失数据。 这次WWDC2024与之前爆料完全一样…

【洛谷P3366】【模板】最小生成树 解题报告

洛谷P3366 -【模板】最小生成树 题目描述 如题,给出一个无向图,求出最小生成树,如果该图不连通,则输出 orz。 输入格式 第一行包含两个整数 N , M N,M N,M,表示该图共有 N N N 个结点和 M M M 条无向边。 接下…

EasyX 文本输出(自定义)函数报错

EasyX 文本输出(自定义)函数报错记录 原因:EasyX与字符串相关的函数,都有字符集问题 UNICODE 多字节字符集

SpringCloud中Eureka和Nacos的区别和各自的优点

Eureka注册中心 Eureka作为一个注册中心,服务提供者把服务注册到注册中心,服务消费者去注册中心拉取信息, 然后通过负载均衡得到对应的服务器去访问。 服务提供者每隔30s向注册中心发送请求,报告自己的状态,当超过一定…

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[3]-参数配置详细版

基于LangChain-Chatchat实现的RAG-本地知识库的问答应用[3]-参数配置详细版 在开始参数配置之前,先执行以下脚本 python copy_config_example.py该脚本将会将所有config目录下的配置文件样例复制一份到config目录下,方便开发者进行配置。 接着,开发者可以根据自己的需求,对…

CSDN 自动上传图片并优化Markdown的图片显示

文章目录 完整代码一、上传资源二、替换 MD 中的引用文件为在线链接参考 完整代码 完整代码由两个文件组成,upload.py 和 main.py,放在同一目录下运行 main.py 就好! # upload.py import requests class UploadPic: def __init__(self, c…

2-13 基于matlab的电力负荷预测

基于matlab的电力负荷预测,论文阐述了负荷预测的应用研究现状,概括了负荷预测的特点及其影响因素,归纳了短期负荷预测的常用方法,并分析了各种方法的优劣;采用最小二乘支持向量机(LSSVM)模型&am…