机器学习-线性回归(简单回归、多元回归)

这一篇文章,我们主要来理解一下,什么是线性回归中的简单回归和多元回归,顺便掌握一下特征向量的概念。

一、简单回归

简单回归线性回归的一种最基本形式,它用于研究**一个自变量(输入)与一个因变量(输出)**之间的线性关系。其数学表达形式为:

y= wx + b

其中:

  • y:因变量(输出),即我们要预测的目标值
  • x:自变量(输入),即影响因变量的已知因素
  • w(权重/斜率):表示自变量对因变量的影响程度
  • b(偏置/截距):表示当 x = 0 时,y 的取值

通俗举例 1:通过身高预测体重

假设我们想要建立一个简单的模型,根据一个人的身高来预测体重,我们有以下数据:

身高(cm)体重(kg)
15050
16060
17070
18080

建模思路:

  • 设身高 x,体重 y,假设两者之间有一个线性关系 y=wx+b。
  • 通过拟合这些数据,模型可能会得到类似的方程: 体重=0.5×身高−25, 在这里:
    • w=0.5(表示每增加 1 cm 身高,体重约增加 0.5 kg)
    • b=−25(表示身高为 0 时的理论体重,但在实际场景中无意义,仅为模型参数)

预测:
如果一个人的身高是 175 cm,则模型预测体重为:

y=0.5×175−25=62.5kg

通俗举例 2:学习时间与考试分数

假设我们想要研究学习时间(小时)对考试分数的影响,收集了一些数据:

学习时间(小时)考试分数(分)
150
255
365
470

建模思路:
我们尝试建立一个简单回归模型来预测分数:

考试分数=10×学习时间+45

在这里:

  • 斜率 w=10(表示每增加 1 小时学习时间,分数提高 10 分)
  • 截距 b=45(表示即使不学习,可能的最低分数是 45 分)

预测:
如果某人学习 5 小时,预测的考试分数为:

10×5+45=95

简单回归的特点

  1. 只涉及一个自变量(单输入)
  2. 假设变量之间是线性关系(如果关系复杂,可能需要更高级的回归方法)
  3. 易于解释和计算(适合初学者理解和使用)

简单回归的应用场景

  • 通过温度预测冰淇淋销量
  • 通过广告支出预测销售额
  • 通过年龄预测血压

二、多元回归

什么是多元回归?

多元回归(Multiple Linear Regression, MLR) 是线性回归的一种扩展,它用于研究**多个自变量(输入)一个因变量(输出)**之间的关系。简单来说,它是一种能同时考虑多个影响因素的回归模型。

多元回归的数学公式:

其中:

  • y:因变量(输出)
  • x1,x2,...,xn:自变量(输入特征)
  • w1,w2,...,wn:各特征的权重(回归系数),衡量每个特征对结果的影响程度
  • b:偏置项(截距),表示所有输入特征为 0 时的输出值

通俗举例 1:房价预测

假设我们想要预测一套房子的价格,影响房价的因素有:

面积(㎡)房龄(年)离市中心距离(km)价格(万元)
10053200
120105180
8022220
1501510150

在这里,我们可以建立一个多元回归模型:

通俗举例 2:学生考试成绩预测

假设某个学生的考试成绩可能受到上课时长、作业完成情况、睡眠时间等因素的影响,我们收集到以下数据:

上课时长(小时)作业完成率(%)睡眠时间(小时)考试成绩(分)
1090885
870670
1295990
650560

建立回归模型:

多元回归的特点

  1. 同时考虑多个因素,适合更复杂的现实场景
  2. 线性关系假设,适用于数据中存在一定的线性相关性
  3. 解释性强,可以分析每个变量对结果的贡献

多元回归的应用场景

  • 市场营销:影响销售额的因素可能包括广告投放、产品价格、品牌影响力等
  • 医学研究:预测患者的疾病风险,考虑年龄、体重、血压、运动习惯等
  • 商业分析:评估员工绩效,考虑工作时长、项目数量、经验等

三、特征向量

如何简单理解特征向量?

通俗来说,特征向量(Feature Vector) 就是用一组数字来描述一个对象的“特征”。在机器学习中,我们用特征向量来表示数据,使得计算机能够处理和学习这些数据的模式。

简单例子 1:水果分类

假设你要训练一个模型来识别不同的水果,比如苹果、橘子、香蕉。我们可以用以下特征来描述水果:

  • 重量(克)
  • 颜色(红色=1,橙色=2,黄色=3)
  • 大小(直径 cm)

如果你拿到一个水果,它的特征如下:

  • 重量:150 克
  • 颜色:1(红色,代表苹果)
  • 大小:8 cm

那么,这个水果可以表示成一个特征向量:

[150,1,8]

同样,橘子和香蕉的特征可能分别是:

[120,2,7](橘子)

[130,3,9](香蕉)

这些特征向量可以作为机器学习模型的输入,让模型学习如何区分不同的水果。

简单例子 2:学生成绩分析

假设你想分析学生的表现,考虑以下特征:

  • 上课时长(小时)
  • 作业完成率(%)
  • 考试成绩(分)

学生 A:

[10, 90, 85]

学生 B:

[8,70,78]

这些数据可以组成特征向量,让我们对学生的学习情况进行分析和预测。

特征向量的特点

  1. 数值化:将现实世界的特征转换为计算机可处理的数值形式。
  2. 多维度:可以同时包含多个属性,描述一个对象的多个方面。
  3. 通用性:适用于分类、回归、聚类等各种机器学习任务。

总结

特征向量就是用一组数字来表示事物的特征,它帮助计算机更好地理解和分析数据。你可以把它想象成一个“数据快照”,每个维度(数值)代表事物的一个属性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/5992.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

5.SQLAlchemy对两张有关联关系表查询

问题 例如,一个用户可以有多个收获地址。 定义表如下: 用户表 地址表 一般情况,我们会先查询用户表,拿到用户id后,再到地址表中查询关联的地址数据。这样就要执行两次查询。 仅仅为了方便查询,需要一些属…

【Unity】ScrollViewContent适配问题(Contentsizefilter不刷新、ContentSizeFilter失效问题)

最近做了一个项目,菜单栏读取数据后自动生成,结果用到了双重布局 父物体 尝试了很多方式,也看过很多大佬的文章,后来自己琢磨了一下,当子物体组件自动生成之后,使用以下以下代码效果会好一些: …

springboot基于微信小程序的商城系统

基于Spring Boot的微信小程序商城系统是一种现代化的电商解决方案,它将Spring Boot框架的强大后端能力与微信小程序的便捷前端体验相结合,为商家和用户提供了高效、稳定的在线购物平台。 一、后端框架 :Spring Boot 1. 简介: 2.…

63,【3】buuctf web Upload-Labs-Linux 1

进入靶场 点击pass1 查看提示 既然是上传文件&#xff0c;先构造一句话木马&#xff0c;便于用蚁剑连接 <?php eval($_POST[123])?> 上传木马 文件后缀写为.php.jpg 右键复制图片地址 打开蚁剑连接 先点击测试连接&#xff0c;显示成功后&#xff0c;再点击添加即可 …

【玩转全栈】----基于ModelForm完成用户管理页面

目录 大致效果 添加用户代码 引入ModelForm ModelForm 与一般表单的区别&#xff1a; ModelForm 与传统 Form 的区别&#xff1a; 使用ModelForm制作用户管理 新建用户 编辑用户&#xff1a; 删除数据 完整代码 在学完前面的部门管理案例后&#xff0c;自己独立写出个用户管理应…

AIGC视频生成模型:ByteDance的PixelDance模型

大家好&#xff0c;这里是好评笔记&#xff0c;公主号&#xff1a;Goodnote&#xff0c;专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance&#xff0c;论文于2023年11月发布&#xff0c;模型上线于2024年9月&#xff0c;同时期上线的模型还有Seaweed&…

深入探究 YOLOv5:从优势到模型导出全方位解析

一、引言 在计算机视觉领域&#xff0c;目标检测是一项至关重要的任务&#xff0c;它在自动驾驶、安防监控、工业检测等众多领域都有着广泛的应用。而 YOLO&#xff08;You Only Look Once&#xff09;系列作为目标检测算法中的佼佼者&#xff0c;一直备受关注。其中&#xff…

Qt —— 控件属性

一、概述 控件有很多属性&#xff0c;我们学习和整理常见和常用的几个属性&#xff0c;由于所有的控件基本都是继承Widget类的&#xff0c;所以前面会先拿Widget类和常见的控件进行示范。 Qt Designer左侧一长条就是Qt给我们内置好的控件&#xff1a; 二、enabled 状态属性 …

会议签到系统的架构和实现

会议签到系统的架构和实现 摘要:通过定制安卓会议机开机APP呈现签到界面&#xff0c;并且通过W/B结构采集管理签到信息&#xff0c;实现会议签到的功能。为达到此目标本文将探讨使用Redis提供后台数据支持&#xff1b;使用SocketIo处理适时消息&#xff1b;使用Flask进行原型开…

WPF实战案例 | C# WPF实现大学选课系统

WPF实战案例 | C# WPF实现大学选课系统 一、设计来源1.1 主界面1.2 登录界面1.3 新增课程界面1.4 修改密码界面 二、效果和源码2.1 界面设计&#xff08;XAML&#xff09;2.2 代码逻辑&#xff08;C#&#xff09; 源码下载更多优质源码分享 作者&#xff1a;xcLeigh 文章地址&a…

JAVA:Spring Boot 实现责任链模式处理订单流程的技术指南

1、简述 在复杂的业务系统中&#xff0c;订单流程往往需要一系列的操作&#xff0c;比如验证订单、检查库存、处理支付、更新订单状态等。责任链模式&#xff08;Chain of Responsibility&#xff09;可以帮助我们将这些处理步骤分开&#xff0c;并且以链式方式处理每一个操作…

stm32单片机个人学习笔记14(USART串口数据包)

前言 本篇文章属于stm32单片机&#xff08;以下简称单片机&#xff09;的学习笔记&#xff0c;来源于B站教学视频。下面是这位up主的视频链接。本文为个人学习笔记&#xff0c;只能做参考&#xff0c;细节方面建议观看视频&#xff0c;肯定受益匪浅。 STM32入门教程-2023版 细…

postgresql15的启动

PostgreSQL是一个功能非常强大的、源代码开放的客户/服务器关系型数据库管理系统&#xff0c;且因为许可证的灵活&#xff0c;任何人都可以以任何目的免费使用、修改和分发PostgreSQL。现在国产数据库大力发展阶段&#xff0c;学习和熟悉postgresql的功能是非常有必要的&#x…

行人识别检测数据集,yolo格式,PASICAL VOC XML,COCO JSON,darknet等格式的标注都支持,准确识别率可达99.5%

作者简介&#xff1a; 高科&#xff0c;先后在 IBM PlatformComputing从事网格计算&#xff0c;淘米网&#xff0c;网易从事游戏服务器开发&#xff0c;拥有丰富的C&#xff0c;go等语言开发经验&#xff0c;mysql&#xff0c;mongo&#xff0c;redis等数据库&#xff0c;设计模…

【前端】CSS实战之音乐播放器

目录 播放器背景旋转音乐封面按钮进度条音量调节音乐信息按钮的效果JavaScript部分播放和暂停音乐切换音乐信息进度条 音量调节避免拖拽时的杂音音量调节条静音和解除静音 自动下一首实现一个小效果最终效果 播放器背景 <div class"play_box"></div>设置…

SSM开发(一)JAVA,javaEE,spring,springmvc,springboot,SSM,SSH等几个概念区别

目录 JAVA 框架 javaEE spring springmvc springboot SSM SSH maven JAVA 一种面向对象、高级编程语言&#xff0c;Python也是高级编程语言&#xff1b;不是框架(框架&#xff1a;一般用于大型复杂需求项目&#xff0c;用于快速开发)具有三大特性&#xff0c;所谓Jav…

rocketmq基本架构

简介 Name server 负责broker注册、心跳&#xff0c;路由等功能&#xff0c;类似Kafka的ZKname server节点之间不互相通信&#xff0c;broker需要和所有name server进行通信。扩容name server需要重启broker&#xff0c;不然broker不会和name server建立连接producer和consum…

【Web】2025-SUCTF个人wp

目录 SU_blog SU_photogallery SU_POP SU_blog 先是注册功能覆盖admin账号 以admin身份登录&#xff0c;拿到读文件的权限 ./article?filearticles/..././..././..././..././..././..././etc/passwd ./article?filearticles/..././..././..././..././..././..././proc/1…

【优选算法】6----查找总价格为目标值的两个商品

这道题相对于前寄到算法题较为容易~ 同样也是使用了双指针的算法哦~ ----------------------------------------begin-------------------------------------- 题目解析&#xff1a; 题目也是很简单地一句话&#xff0c;但是意图还是很明确~ 讲解算法原理&#xff1a; 同样的&…

github登录用的TOTP和恢复码都丢失了怎么办

从22年左右开始github的登录就需要用TOTP的一个6位秘钥做二次认证登录&#xff0c;如果在用的TOTP软件失效了&#xff0c;可以用github开启二次认证时下载的恢复码重置认证&#xff0c;但是如果你和我一样这两个东西都没了就只能用邮箱重置了&#xff0c;过程给大家分享一下 一…