(9)数据分析-相关性分析

文章目录

  • 1、运用场景
  • 2、图形描述相关性
    • 2.1使用场景
    • 2.2 代码实现
    • 2.3 效果呈现
  • 3、正态资料相关性分析
    • 3.1 使用场景
    • 3.2 皮尔森相关系数
    • 3.3 代码实现
    • 3.4 结果分析
  • 4、非正太资料的相关分析
    • 4.1 使用场景
    • 4.2 斯皮尔曼等级相关系数
    • 4.3 代码实现
    • 4.4 结果分析

1、运用场景

  相关性分析是研究两个或两个以上随机变量间相关关系的统计方法。在数据分析中,它常用于分析连续型自变量X与连续型因变量Y之间的关系。在待分析特征较少时,可使用做图法分析,特征较多时,可使用皮尔森或者斯皮尔曼等工具分析,这这些只能判断线性关系,如果要判断非线性关系,则可将连续数组分组以后使用方差分析对比各组之间的差异。

2、图形描述相关性

2.1使用场景

  待分析的特征较少
  散点图是在两变量相关性分析分析时最常用的展示方法。如下图所示。请添加图片描述

本文使用Statsmodels 自带的 ccard数据集, 展示其中的INCOMESQ与IMCOME两个变量的相关性

2.2 代码实现

import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
from statsmodels.datasets import ccarddata = ccard.load_pandas().data
print(data)
plt.scatter(data['INCOMESQ'],data['INCOME'])
plt.grid()
plt.show()

2.3 效果呈现

在这里插入图片描述

3、正态资料相关性分析

3.1 使用场景

  待分析特征较多。可用它来分析正态分布的两个连续型变量之间的相关性,常用于分析自变量之间,以及自变量与因变量之间的相关性。

3.2 皮尔森相关系数

  皮尔森相关系数是反应两个变量之间线性相关程度的统计量。

3.3 代码实现

import numpy as npa = np.random.normal(0,1,100)
b = np.random.normal(2,2,100)
print(stats.pearsonr(a,b))

3.4 结果分析

#(0.10245068885435506, 0.3104404938078574)
  • ret1:相关系数,其取值范围为[-1,1]。其值接近于1,正相关正读越强,接近于-1,负相关性越强,接近于0,相关性弱。
  • ret2:p-value:皮尔森相关系数原假设为两组数据不存在相关性。p-value >0.05 接受原假设。

4、非正太资料的相关分析

4.1 使用场景

  待分析特征较多,只考虑从变量值的顺序(rank,秩或称等级),而不考虑变量值的大小,常用于计算有序的类型变量的相关性。可以用于非正太变量的相关性检验,但是它只考虑数据大小的顺序,而不考虑具体的值,导致会丢失部分信息。

4.2 斯皮尔曼等级相关系数

  主要用于评价顺序变量间的线性相关关系。

4.3 代码实现

from scipy import stats
import numpy as npa = np.array([1,2,3,4,5])分析
b = np.array([1,6,7,8,20])
print(stats.spearmanr(a,b))

4.4 结果分析

SpearmanrResult(correlation=0.9999999999999999, pvalue=1.4042654220543672e-24)
  • correlation:相关系数
  • p-value:原假设为两组数据之间不存在相关性,p-value < 0.05 原假设

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/63323.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据分析之数据相关性分析

相关性分析 作者&#xff1a;学者科技 时间&#xff1a;2022/12/25 应用场景 发现数据之间的关联性 比如 啤酒 和 尿布 删减统计指标 比如 城市里的温度传感器&#xff0c;相关性强的可以去掉以节约成本 挑选回归建模的变量 选择与因变量相关性高的自变量自变量间如果有高度…

数据特征分析技能—— 相关性检验

数据特征分析技能—— 相关性检验 相关性分析是指对两个或多个具备相关性的变量元素进行分析&#xff0c;从而衡量两个变量因素的相关密切程度 一般常用四种方法&#xff1a; - 画图判断 - pearson&#xff08;皮尔逊&#xff09;相关系数 - sperman&#xff08;斯皮尔曼&a…

印刷品的排版技巧

印刷品的精美离不开精美的排版&#xff0c;排版设计能够让书本杂志标题规整好看。随着设计素材的丰富&#xff0c;现在设计师可以有越来越多的选择&#xff0c;不过有时候过多的元素在设计并不能起到画龙点睛的作用&#xff0c;相反经常会发现一些排版设计十分杂乱&#xff0c;…

微信公众号排版方法及相关素材网站

作者&#xff1a;杨坤龙 链接&#xff1a;https://www.zhihu.com/question/23640203/answer/375921114 来源&#xff1a;知乎 著作权归作者所有。商业转载请联系作者获得授权&#xff0c;非商业转载请注明出处。 关于排版 前段时间我发了条朋友圈&#xff1a;有哪些东西是你…

关于文案排版的一些基本技巧

一、主文案 1. 什么是主文案 关于首页&#xff0c;会涉及到主文案&#xff0c;副文案&#xff0c;装饰性文案等。一个文案中最重要的是主文案&#xff0c;所谓主文案就是你想突出什么&#xff0c;什么就是主文案&#xff0c;主文案一般就是口号类的&#xff0c;标语&#xff0c…

一些实用排版工具

三年前我什么都不懂的时候&#xff0c;就听闻了高大上的LaTeX&#xff0c;还去听了图书馆某工科博士开的LaTeX入门讲解&#xff0c;听的天花乱坠毫无头绪&#xff0c;回去兴冲冲地装上&#xff0c;运行&#xff0c;出现bug&#xff0c;然后傻眼了&#xff0c;解决不了&#xff…

【工具】用PPT排版打印海报时图片分辨率问题

版本&#xff1a;PPT 2013 PPT用来排版做海报也许不是那么好&#xff0c;但是可以用&#xff0c;也方便。【工具】PPT插入高清图片保存后图片变模糊的解决方法&#xff0c;这里解决了高清图片在PPT中被压缩的问题&#xff0c;但用PPT打印还会碰到问题。 将PPT打印为pdf时&…

135编辑器点击换图html,这5种换图姿势,只有排版高手才会!

换图教程 胖友们&#xff0c;欢迎来看二条&#xff01; 最近客服小姐姐一直催我写一篇关于换图的教程&#xff0c;我就不明白了&#xff01;去年答应你的事&#xff0c;我怎么能拖那么久...你怎么还记得那么清楚&#xff01; 好吧&#xff0c;教程开始。 135编辑器给图片/图片样…

ChatGLM的搭建过程

本次搭建的是清华大学开源的ChatGLM。源码地址。模型地址。 1、开启BBR加速 如何开启BBR加速可以去看我的这篇文章&#xff0c;Linux开启内核BBR加速。 2、拉取ChatGLM源码和ChatGLM模型 点击这里跳转到源码处。 点击这里跳转到模型下载处。 我这里在下载之前创建了一个目…

道指30只成分股的股价及历史股价抓取分析

1.获取数据: 想要获得道指30只成分股的最新股价 import requests import re import pandas as pddef retrieve_dji_list():try:r requests.get(https://money.cnn.com/data/dow30/)except ConnectionError as err:print(err)search_pattern re.compile(class"wsod_sym…

短信验证码接口的实现

代码&#xff1a; sendsms.java //接口类型&#xff1a;互亿无线触发短信接口&#xff0c;支持发送验证码短信、订单通知短信等。 // 账户注册&#xff1a;请通过该地址开通账户http://sms.ihuyi.com/register.html // 注意事项&#xff1a; //&#xff08;1&#xff09;调试…

交友项目【手机号验证码发送】功能实现

目录 1&#xff1a;注册登录需求分析 1.1&#xff1a;业务说明 1.2&#xff1a;需求分析 1.3&#xff1a;数据库表 1.4&#xff1a;实体类 2&#xff1a;发送短信验证码 2.1&#xff1a;登录验证码 2.2&#xff1a;接口说明 2.3&#xff1a;流程分析 2.4&#xff1a;…

免费的短信验证码接口

免费的短信验证码接口 改了唯ID的东西&#xff0c;大家可以用来玩玩&#xff0c;该服务明年6月到期&#xff0c;也希望大家能文明使用&#xff01; 不说废话了&#xff0c;直接上接口。 1、发送短信验证码接口 POST http://sms.usts.top/sms/sendCode?phone手机号2、…

短信验证码平台有哪些比较好用?

现如今&#xff0c;要想分辨短信验证码平台哪些比较好用&#xff0c;需要从速度、到达率、稳定性等几个方面来决定。短信验证码平台是很讲究时效性&#xff0c;所以速度快、到达率高是很关键的。另外&#xff0c;在选择短信验证码平台的时候&#xff0c;还要注意短信发送、接收…

短信验证码的实现

需求 发送验证码短信然后接收验证码再完成注册 具体操作 1>点击"获取验证码"的按钮,会发送sendVerifyCode的异步请求并带上参数phone(number) 查看前端代码html 查看对应的js代码 2>后端接口的实现 接口接收请求,获取到手机号,生成验证码code,拼接出短信,并…

目前可以用的短信验证码平台哪个比较好?

目前短信验证码大家应该都很熟悉了&#xff0c;尤其当你在一些购物网站等注册会员或者修改信息时都需要验证码。而短信验证码是商家为了降低重复注册或者非法注册&#xff0c;就需要短信验证码来帮忙用户的真实性。那么&#xff0c;目前可以用的短信验证码平台哪个比较好呢&…

短信验证码登录的实现

原理说明开发环境具体实现过程 原理说明 在网站登录时经常会遇到短信验证码登录的情况&#xff0c;其原理如下&#xff1a;首先我们需要一个短信发送接口&#xff0c;前端发送手机号码到后端&#xff0c;后端随机生成一个验证码并存入redis,并且设置该key的过期时间。(这里可以…

低代码真的是“行业毒瘤”?

低代码/零代码到底是“行业毒瘤”还是“大势所趋”&#xff1f;碰瓷“码农”万年户&#xff0c;低代码火了这些年&#xff0c;你还觉得是毒瘤吗&#xff1f; 低代码/零代码作为比较有争议的话题&#xff0c;常年被拿来碰瓷码农&#xff0c;也是很多行业大佬关注的对象。 阿里云…

chatgpt赋能python:Python如何下载人人文库

Python如何下载人人文库 人人文库是一个知识分享社区&#xff0c;用户可以在平台上上传、下载和分享文档。 Python是一种强大的编程语言&#xff0c;具有强大的网络和数据处理库。今天&#xff0c;我们将介绍如何使用Python来下载人人文库中的文档。 首先&#xff0c;我们需…

秘密共享差分隐私原理解析

1. 隐私计算全貌 &#xfffc;&#xfffc; 可以看到&#xff0c;隐私计算技术从1979年就开始了&#xff0c;历经四代从安全多方计算(MPC)、到差分隐私(DP)、到集中加密技术(TEE)&#xff0c;再到联邦学习(FL)。 2. 秘密共享 secret Sharing 就是“秘密分享”或者“秘密共享”…