数据分析之回归分析

回归分析

  • 1、概述
  • 2、分类
  • 3、线性回归
    • 3.1 单变量线性回归
    • 3.2 多变量线性回归
    • 3.3 线性回归分析的步骤:
  • 4、评价回归算法的指标
  • 5、Excel 实践

1、概述

\quad \quad 回归分析(Regression)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法,它主要研究一个随机变量 Y 对另一个变量(X)或一组(X1,X2,…,Xk)变量的相依关系。

2、分类

  • 按照涉及的变量的多少,分为一元回归和多元回归分析;

  • 按照因变量的多少,可分为简单回归分析和多重回归分析;

  • 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。

3、线性回归

3.1 单变量线性回归

3.2 多变量线性回归

3.3 线性回归分析的步骤:

  • 确定自变量和因变量,并计算自变量和因变量之间的相关系数。

  • 绘制散点图,确定回归模型类型

  • 估计模型参数,建立回归模型:最小二乘法进行模型参数估计

  • 对回归模型进行检验

  • 利用回归模型进行预测

4、评价回归算法的指标

1.R值
在统计学中R值是拟合优度指数,用来评价模型的拟合好坏等,取值范围是【-1,1】,越接近正负1越好。对应R平方来说越接近1越好。
R值的大小

2.P值
在统计学中P值是指(F检验或者T或者其余检验量)大于所求值时的概率,一般要小于给定α就说明检验显著。P值是检验样置信度的一个指标,一般我们认为p<=0.05时(一般选择这个显著水平),模型的信号不存在偶然性,模型的结果可靠。

5、Excel 实践

1、目标:研究销售收入和利润之间的关系,以更好的预测未来的销售目标
2、数据:数据如下
在这里插入图片描述
3、计算销售收入和利润两者的相关系数
在这里插入图片描述

相关系数为0.98,足以说明两者正强相关。
4、绘制散点图
在这里插入图片描述

5、回归分析
在这里插入图片描述
输出结果如下:
在这里插入图片描述

1、 先看回归统计表,Multiple R即相关系数R的值,和我们之前做相关分析得到的值一样,大于0.8表示强正相关。

2、 回归统计表中的R Square是R平方值,R平方即R的平方,又可以叫判定系数、拟合优度,取值范围是[0,1],R平方值越大,表示模型拟合的越好。一般大于70%就算拟合的不错,60%以下的就需要修正模型了。这个案例里R平方0.97,相当不错。

3、 Adjusted R是调整后的R方,这个值是用来修正因自变量个数增加而导致模型拟合效果过高的情况,多用于衡量多重线性回归。

4、 第二张表,方差分析表,df是自由度,SS是平方和,MS是均方,F是F统计量,Significance F是回归方程总体的显著性检验,其中我们主要关注F检验的结果,即Significance F值,F检验主要是检验因变量与自变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当,越小越显著。这个案例里F值很小,说明因变量与自变量之间显著。

5、 残差是实际值与预测值之间的差,残差图用于回归诊断,回归模型在理想条件下的残差图是服从正态分布的。

6、 第三张表我们重点关注P-value,也就是P值,用来检验回归方程系数的显著性,又叫T检验,T检验看P值,是在显著性水平α(常用取值0.01或0.05)下F的临界值,一般以此来衡量检验结果是否具有显著性,如果P值>0.05,则结果不具有显著的统计学意义,如果0.01<P值<0.05,则结果具有显著的统计学意义,如果P<=0.01,则结果具有极其显著的统计学意义。

T检验是看某一个自变量对于因变量的线性显著性,如果该自变量不显著,则可以从模型中剔除。 p值越小,越好。

7、 从第三张表的第一列我们可以得到这个回归模型的方程:
y=0.13x-2.46,此后对于每一个输入的自变量x,都可以根据这个回归方程来预测出因变量Y。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/68716.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Excel做回归分析

Excel数据分析工具库是个很强大的工具&#xff0c;可以满足基本的统计分析&#xff0c;这里介绍用Excel数据分析工具库中的回归做回归分析。本文仅作为学习笔记之用&#xff0c;欢迎各位交流指正。 本节知识点&#xff1a; Excel数据分析工具库—回归 线性回归和非线性回归 简…

《数据分析实战》--用R做多元回归分析

《数据分析实战》——用R做多元回归分析 本文参考的是《数据分析实战》的第六章。 背景&#xff1a;针对某公司对产品的不同广告平台投放&#xff0c;基于过去的新增用户数据和投放数据&#xff0c;希望获得更好的广告投放方式&#xff0c;以此建立数据模型。 现状&#xff…

公众号运营5大技巧,自媒体人非常适用

互联网时代&#xff0c;公众号算是一种很常见的一种推广渠道&#xff0c;常用的方式就是通过公众号来推广内容&#xff0c;传递信息&#xff0c;表达自己的观点&#xff0c;宣传自己的品牌等。今天就和大家分享一下公众号新手如何开展运营。 1.明确定位 首先要做的&#xff0c…

想要快速入门自媒体,这些自媒体运营方法一定要知道

其实自媒体入门真的很简单&#xff0c;今天小易就来教教你们如何快速入门自媒体。入门自媒体不仅是看你的内容创作能力&#xff0c;还要你的工具使用能力&#xff0c;所以要熟悉一些必要的自媒体工具对你的帮助会很大。 下面就讲讲自媒体工具易撰在创作中的用途&#xff1a; 第…

国家出手管人工智能AI了

我是卢松松&#xff0c;点点上面的头像&#xff0c;欢迎关注我哦&#xff01; 全球都在封杀AI&#xff0c;国家也出手了&#xff0c;人工智能AI的强监管来了!这次反应速度算是很快了。国家出手&#xff0c;AI必须管。 国家网信办拟针对生成式人工智能服务出台管理办法&#…

GPT 的火爆将如何影响由 NFT 重塑的艺术世界

撰文&#xff1a;Edward Lee 来源&#xff1a;FreeThink 图片来源&#xff1a;由无界 AI工具生成 在过去的几个月里&#xff0c;世界见证了 GPT 令人炫目的能力。它们最革命性的突破之一是根据对 GPT 程序&#xff08;如 DALL-E、Midjourney 和 Stable Diffusion&#xff09;的…

go每日新闻--2020-12-30

go中文网每日资讯--2020-12-30 一、#公众号&#xff1a;Go语言中文网 由 C# 改为 Go&#xff0c;用更少的资源将 API 的响应时间减少了 87&#xff05; 长沙也有 Go 职位了&#xff1a;映客直播招聘 Go 开发高级工程师 Go 经典入门系列 30&#xff1a;错误处理 二、#公众号&am…

2020 Week12:11月30日——12月6日

2020 Week12&#xff1a;11月30日——12月6日 周报 本周目标本周完成详情下周目标markdown语法新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、…

go每日新闻--2020-02-26

go语言中文网(每日资讯)_2020-02-26 一、Go语言中文网 【每日一库】类似 database/sql 的抽象层&#xff0c;但用于 Key-Value 存储 整洁架构&#xff08;Clean Architecture&#xff09;的Go微服务: 设计原则 从零开始入门 K8s | Kubernetes API 编程利器&#xff1a;Oper…

NKN双周报 2020年4月1日至2020年4月15日

亮点 • NKN与爱奇艺携手提升流媒体视频质量 • NKN携手物联网区块链平台IoTeX&#xff0c;举办智能家居安全研讨会 • NKNx在Telegram的便捷机器人NKNxCompanion上线 • NKN顾问Stephen Wolfram邀您加入“Wolfram物理计划”&#xff0c;共同探索宇宙原理 • 缅…

数据可视化神器pyecharts Graph绘制关系图

#关系可视化 from pyecharts import options as opts from pyecharts.charts import Graph from pyecharts.globals import ThemeTypeimport webbrowser #---------------------------------------#主要设置 #InitOpts&#xff1a;初始化配置项&#xff08;在图形创建开始时即可…

Echarts绘制各种数据可视化图表案例(效果+代码)

Echartshtml绘制各种图表案例 注意&#xff1a;要先下载echarts.min.js1、echarts绘制雷达图2、echarts绘制饼图3、echarts绘制柱形图4、echarts绘制折线图6、echarts绘制嵌套饼图7、echarts绘制散点图8、echarts绘制折线面积图9、echarts绘制漏斗图10、echarts绘制仪表盘11、e…

超全!52个数据可视化图表鉴赏~~

一、数据可视化 是关于数据视觉表现形式的科学技术研究。其中&#xff0c;这种数据的视觉表现形式被定义为&#xff0c;一种以某种概要形式抽提出来的信息&#xff0c;包括相应信息单位的各种属性和变量。它是一个处于不断演变之中的概念&#xff0c;其边界在不断地扩大。主要指…

_token mtgsig +数据可视化(excel powerbi tableau)

马上要6月了,趁着考试前还有点时间打算水一篇文章,正好最近搞了搞某团,又学了点可视化,于是打算把逆向和可视化一起讲解了. mtweb端上有很多网址,目前发现3个,其中有一个网址是一点加密都没有,还有一个只有一个单独的mtgsig,另一个是mtgsig和_token两个参数. 网址1(无加密):…

数据可视化-图表

前文提要&#xff1a;看完上一篇文章的小伙伴&#xff0c;相信都已经清楚图表的基本视觉构造及其相对于的设计要点。这是图表设计系列的第二篇文章&#xff0c;这篇主要讲述选择图表和常见的图表类型这两个部分。全文共7600字左右&#xff0c;阅读时长20分钟&#xff5e; 懒人目…

数据分析可视化04 图表组件:Echarts数据可视化图表基础

本课时是课程的第二个模块&#xff0c;环境部署篇的第一个课时。在第一部分的基础理论篇&#xff0c;我向你介绍了数据可视化分析的概念定义、方法体系和关键技术。接下来&#xff0c;我会带你了解基于开源框架&#xff0c;如何部署数据可视化分析的开发环境&#xff0c;内容包…

一行代码生成Tableau可视化图表

今天给大家介绍一个十分好用的Python模块&#xff0c;用来给数据集做一个初步的探索性数据分析(EDA)&#xff0c;有着类似Tableau的可视化界面&#xff0c;我们通过对于字段的拖拽就可以实现想要的可视化图表&#xff0c;使用起来十分的简单且容易上手&#xff0c;学习成本低&a…

数据可视化 - Echarts图表

可视化项目 代码 - - > 底部 01-项目介绍 ​ 应对现在数据可视化的趋势&#xff0c;越来越多企业需要在很多场景(营销数据&#xff0c;生产数据&#xff0c;用户数据)下使用&#xff0c;可视化图表来展示体现数据&#xff0c;让数据更加直观&#xff0c;数据特点更加突出…

数据可视化:绘制部分图表的核心代码实现

matplotlib和pyecharts绘制图表 pyecahrts漏斗图核心代码地图核心代码柱状图核心代码组合图表核心代码数据大屏核心代码 matplotlib棉棒图核心代码饼图核心代码词云图核心代码组合图表核心代码 开发语言及版本Python3.7第三方库及版本号jieba 0.42.1matplotlib3.3.4imageio2.9.…

【五子棋实战】第4章 部署五子棋计算接口到Window、Linux上

【五子棋实战】第4章 部署五子棋计算接口到Window、Linux上 python项目打包成exe可执行文件 ## 步骤一、安装pyinsatller ## 步骤二、使用pyinstaller打包Python程序 ## 操作演示 ## 注意事项&#xff01;&#xff01; python的Flask接口部署&#xff08;Linux&#xff09; ##…