回归——数学公式推导全过程

文章目录

一、案例引入

二、如何求出正确参数

1. 最速下降法

1)多项式回归

2)多重回归

2. 随机梯度下降法


一、案例引入

以Web广告和点击量的关系为例来学习回归,假设投入的广告费和点击量呈现下图对应关系。

思考:如果花了200元的广告费,广告的点击量会是多少呢?

机器学习就是从给出的数据(训练数据)中进行学习,当你提供未知数据(200广告费)后,给出预测值(500左右点击量)。

实现原理:把图想象为函数,只要知道通过图中各点的函数的形式,就能根据广告费得知点击量。

定义一次函数的表达式        "西塔0,西塔1"  我们称之为参数,也就是一次函数的斜率和截距。

将训练数据中的广告费代入fθ(x),把得到的点击量与训练数据中的点击量相比较,然后找出使二者的差最小的θ。

假设有n个训练数据,那么它们的误差之和可以用这样的表达式表示。这个表达式称为目标函数,E(θ)的E是误差的英语单词Error的首字母。

对每个训练数据的误差取平方之后,全部相加,然后乘以1/2。这么做是为了找到使E(θ)的值最小
的θ。这样的问题称为最优化问题。(取平方是为了让误差值都大于0,最后乘以1/2是为了让后面计算微分更方便而加上去的)

二、如何求出正确参数

1. 最速下降法

比如有一个表达式为的二次函数,它的最小值是g(x)=0,出现在 x =1时。

将g(x)展开后取微分:

增减表如下所示:

比如在x=3这一点,为了使g(x)的值变小,我们需要向左移动 x,也就是必须减小x

如果是在另一侧的x=−1这一点,为了使g(x)的值变小,我们需要向右移动x,也就是必须增加x

只要向与导数的符号相反的方向移动x,g(x)就会自然而然地沿着最小值的方向前进了

用表达式展示出来:        这种方法称为最速下降法或梯度下降法

(A:=B这种写法,它的意思是通过B来定义A。)

η读作“伊塔”,称为学习率的正的常数。根据学习率的大小, 到达最小值的更新次数也会发生变化。换种说法就是收敛速度会不同。

假设η=0.1,从x=3开始

 x := 3−0.1×(2×3−2) =3 −0.4=2.6
 x := 2.6−0.1×(2×2.6−2)=2.6−0.3=2.3
 x := 2.3−0.1×(2×2.3−2)=2.3−0.2=2.1
 x := 2.1−0.1×(2×2.1−2)=2.1−0.2=1.9

而当η较小时,移动量也变小,更新次数就会增加,值也会不断朝着收敛的方向而去。

回过头来看一下上面案例中的目标函数E(θ)

这个目标函数和刚才例子中的g(x)同样是开口向上的形状,所以刚才推导的过程也同样适用于它。不过这个目标函数中包含fθ(x),从表达式(一次函数)中又可以看出,fθ(x)拥有θ0和 θ1两个参数。也就是说这个目标函数是拥有θ0和θ1的双变量函数,所以不能用普通的微分,而要用偏微分。如此一来,更新表达式就是这样的。

E(θ)中有fθ(x),而fθ(x)中又有θ0,所以使用复合函数的微分

     然后再像这样阶梯性地进行微分    

      

左侧最后一行,常数与1/2相抵消了,这就是一开始为什么乘以1/2。

最后得到对θ0求导的表达式:

   

同样对θ1求导得出:

所以参数θ0和θ1的表达式是这样:

根据这个表达式来更新θ0 和θ1,找到正确的fθ(x),然后输入任意的广告费,就可以得到相应的点击量。这样我们就能根据广告费预测点击量了。

1)多项式回归

对于一开始在图中的数据点来说,其实曲线比直线拟合得更好。

把fθ(x)定义为二次函数,就能用它来表示这条曲线了

或者用更大次数的表达式也可以。这样就能表示更复杂的曲线了

对于要解决的问题,在找出最合适的表达式之前,需要不断地去尝试,虽然次数越大拟合得越好,但难免也会出现过拟合的问题。

回到刚才二次函数,最终的参数更新表达式是这样的:

像这样增加函数中多项式的次数,然后再使用函数的分析方法被称为多项式回归。

2)多重回归

之前只是根据广告费来预测点击量,实际生活中决定点击量的除了广告费之外,还有广告的展示位置和广告版面的大小等多个要素。

为了让问题尽可能地简单,我们只考虑广告版面的大小,设广告费为x1、广告栏的宽为x2、广告栏的高为x3,那么fθ可以 表示如下:

在分别求目标函数对θ0,··· ,θ3的偏微分,然后更新参数之前,我们先试着简化表达式的写法。

把参数θ和变量x看作向量:

把θ转置之后,计算它与x相乘的结果,也就是:

之前用多项式表示的fθ,可以像这样用向量来表:

还是设u=E(θ)、v =fθ(x),为了一般化,对第j个参数θj偏微分的表达式

       

    

那么第j个参数的更新表达式就是这样:

像这样包含了多个变量的回归称为多重回归

2. 随机梯度下降法

在引入随机梯度下降法之前,我们先来看下最速下降法的一些缺点:

1. 计算量大、计算时间长

当训练数据很多的时候,最速下降法要对所有的训练数据都重复进行计算。

2. 容易陷入局部最优解

给出稍微复杂一点形状的函数

用最速下降法来找函数的最小值时,必须先要决定从哪个x开始找起。之前用g(x)说明的时候是从x=3或者x=−1开始的。选用随机数作为初始值的情况比较多。不过这样每次初始值都会变,进而导致陷入局部最优解的问题

假设这张图中标记的位置就是初始值,从这个点开始找,可以求出最小值

把下图所示作为初始值位置,没计算完就会停止。这就是陷入局部最优解。

最速下降法的参数更新表达式:

这个表达式使用了所有训练数据的误差,而在随机梯度下降法中会随机选择一个训练数据,并使用它来更新参数。这个表达式中的k就是被随机选中的数据索引。

最速下降法更新1次参数的时间,随机梯度下降法可以更新n次。此外,随机梯度下降法由于训练数据是随机选择的,更新参数时使用的又是选择数据时的梯度,所以不容易陷入目标函数的局部最优解

此外还有随机选择m个训练数据来更新参数的做法,设随机选择m个训练数据的索引的集合为K,那么我们这样来更新参数:

假设训练数据有100个,那么在m=10时,创建一个有10个随机数的索引的集合,例如K={61, 53, 59, 16, 30, 21, 85, 31, 51, 10}。这种做法被称为小批量(mini-batch)梯度下降法。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41155.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【AVRCP】深度解析蓝牙高速(AMP)在封面艺术传输中的应用:低延迟体验的工程实践

目录 一、AMP 技术架构与封面艺术传输需求 1.1 蓝牙高速技术背景 1.2 AMP技术原理 1.3 蓝牙协议栈演进(AMP 协议栈架构) 1.4 封面艺术传输的技术挑战 1.5 AMP 关键特性(BR/EDR vs AMP 对比) 1.6 封面艺术传输模型&#xff…

Spring Boot 连接 MySQL 配置参数详解

Spring Boot 连接 MySQL 配置参数详解 前言参数及含义常用参数及讲解和示例useUnicode 参数说明: 完整配置示例注意事项 前言 在 Spring Boot 中使用 Druid 连接池配置 MySQL 数据库连接时,URL 中 ? 后面的参数用于指定连接的各种属性。以下是常见参数…

智能科技与美学融合,赵伟辰荣膺 2025 iF 设计大奖

近日,全球设计界享有盛誉的 iF 设计奖(iF Design Award)正式公布 2025 年度获奖名单。设计师赵伟辰凭借其创新力作Multi-Scenario Modular Control System(多场景模块化控制系统),从全球 10,000 余件参赛作品中脱颖而出,斩获这一全球瞩目的奖项。他凭借卓越的用户体验优化能力与…

NotePad++与Navicat工具的下载 完全免费无套路

https://qr61.cn/o7ciDN/qINyVn3 打开链接 获取下载即可 免费 免费 免费 重要的事情说三遍! 这是本人自己搜集资源与发布和共享的最新版,无任何费用 需要工具自行下载即可。 由于人少力薄 资源更新较慢 请大家耐心等待 多多关注 谢谢~ 下面给大家截图…

K8S学习之基础五十一:k8s部署jenkins

k8s部署jenkins 创建nfs共享目录, mkdir -p /data/v2 echo /data/v2 *(rw,no_root_squash) > /etc/exports exportfs -arv创建pv、pvc vi pv.yaml apiVersion: v1 kind: PersistentVolume metadata:name: jenkins-k8s-pv spec:capacity:storage: 1GiaccessMod…

印刷电路板 (PCB) 的影响何时重要?在模拟环境中导航

我和我的同事们经常被问到关于 PCB 效应的相同问题,例如: 仿真何时需要 PCB 效果? 为什么时域仿真需要 PCB 效应? 当 PCB 效应必须包含在仿真中时,频率是否重要? 设计人员应该在多大程度上关注 VRM 模型中包…

车载以太网网络测试 -24【SOME/IP概述】

目录 1 摘要2 车载SOME/IP 概述2.1发展背景以及应用2.1.1车载 SOME/IP 背景2.1.2 车载 SOME/IP 应用场景 2.3 什么是SOME/IP2.3.1 SOME/IP定义2.3.2 SOME/IP在协议栈中的位置 3 SOA是什么4 SOME/IP主要功能5 SOME/IP标准 1 摘要 本文主要介绍SOME/IP的背景以及在车载行业的发展…

如何在 Postman 中导入和导出 cURL 命令?

cURL 是一款广受欢迎的命令行工具,专门用于执行 HTTP 请求。它在 Web 应用或 API 测试中极为实用,让用户得以借助在 API 开发者社区广为流行的成熟语法,直接通过命令行与 API 进行交互。若你需要在多个环境下运行众多 cURL 命令,可…

K8S学习之基础五十五:k8s中jenkins部署blueOcean

jenkins部署blueOcean 安装插件 BLUE OCEAN 之后会多出一个菜单,可以更详细方便的查看pipeline流程

宝塔docker flarum默认登录账号密码,crazymax/flarum镜像默认登录账号密码

docker flarum默认账号密码 刚创建完毕时的登录账号和密码都是flarum 来源说明 宝塔安装的这个1.8.5版本的docker flarum的版本是,用的是 Docker库 https://hub.docker.com/r/crazymax/flarum Github库 https://github.com/crazy-max/docker-flarum

3.26学习总结

今天主要学习了内部类,但总感觉有点混乱,和之前的抽象啊,接口,多态等概念联系在一起感觉更混乱了,所以打算先把最近学的理清一遍,敲一遍代码再往后学

如何快速解决 Postman 报错?

介绍一些 Postman 常见的报错与处理方法,希望能够对大家有所帮助。 Postman 一直转圈打不开的问题 Postman 报错处理指南:常见报错与解决方法

高铁监控存储扩容-DS SAN存储磁盘阵列

国家高铁建设之内蒙包银高铁线路段--近期升级改造车站监控设备存储扩容,每个车站的机房承载本站数百个监控点位的数据,现因监控服务器存储空间不足,选用Infortrend DS SAN存储磁盘阵列升级设备存储空间,单台DS最高支持448颗硬盘容…

rnn的ho的维度 (num_layers * num_directions, batchsize, hidden_size)

因为是多层rnn 所以h0 需要 num_layers 来定义几层 这里的hidden_size 其实也就是h中有多少个神经元的个数

同旺科技USB to I2C 适配器 ---- 多从机设备混合调试

所需设备: 内附链接 1、同旺科技USB to I2C 适配器 1、还在为一条I2C总线上出现多个从机设备而烦恼吗?现在这些都可以轻松解决了,在 "发送数据" 栏里面,修改指令的从机地址就可以了,同时支持7Bit、8Bit地址…

如何下载 Postman?快速指南!

Postman 是一款非常受欢迎的 API 测试工具。它最初是作为一个 Chrome 插件发布,后来发展成为一款独立的跨平台软件,支持 Windows、Mac、Linux 等操作系统。 Postman 怎么下载教程(2025最新版)?

VSCode 抽风之 两个conda环境同时在被激活

出现了神奇的(toolsZCH)(base) 提示符,如下图所示: 原因大概是:conda 环境的双重激活:可能是 conda 环境没有被正确清理或初始化,导致 base 和 toolsZCH 同时被激活。 解决办法就是 :conda deactivate 两次…

idea接入 AI 编程助手:Copilot

1.1 安装 GitHub Copilot 插件 打开 IntelliJ IDEA,进入 File > Settings(Windows)或 Preferences(Mac)。在 Plugins 搜索 GitHub Copilot。点击 Install 并重启 IDEA。 1.2 配置 GitHub Copilot 进入 Settings &g…

23种设计模式-工厂方法(Factory Method)设计模式

工厂方法设计模式 🚩什么是工厂方法设计模式?🚩工厂方法模式的特点🚩工厂方法模式的结构🚩工厂方法模式的优缺点🚩抽象工厂模式的Java实现🚩代码总结🚩总结 🚩什么是工厂…

LLM之Agent(十四)| 字节开源ComputerUse纯视觉驱动GUI 智能体模型 UI-TARS

Agent TARS 是字节跳动于 2025 年 3 月开源的多模态 AI 智能体,它能够像人类一样操作电脑、手机和网页,完成各种复杂任务。以下是其详细介绍: 一、简介 Agent TARS 是一款开源的多模态 AI 智能体,能够基于视觉理解网页内容&#…