（9）数据分析-相关性分析

文章目录

1、运用场景
2、图形描述相关性
- 2.1使用场景
- 2.2 代码实现
- 2.3 效果呈现
3、正态资料相关性分析
- 3.1 使用场景
- 3.2 皮尔森相关系数
- 3.3 代码实现
- 3.4 结果分析
4、非正太资料的相关分析
- 4.1 使用场景
- 4.2 斯皮尔曼等级相关系数
- 4.3 代码实现
- 4.4 结果分析

1、运用场景

相关性分析是研究两个或两个以上随机变量间相关关系的统计方法。在数据分析中，它常用于分析连续型自变量X与连续型因变量Y之间的关系。在待分析特征较少时，可使用做图法分析，特征较多时，可使用皮尔森或者斯皮尔曼等工具分析，这这些只能判断线性关系，如果要判断非线性关系，则可将连续数组分组以后使用方差分析对比各组之间的差异。

2、图形描述相关性

2.1使用场景

待分析的特征较少
散点图是在两变量相关性分析分析时最常用的展示方法。如下图所示。请添加图片描述

本文使用Statsmodels 自带的 ccard数据集，展示其中的INCOMESQ与IMCOME两个变量的相关性

2.2 代码实现

import pandas as pd
from scipy import stats
import matplotlib.pyplot as plt
from statsmodels.datasets import ccarddata = ccard.load_pandas().data
print(data)
plt.scatter(data['INCOMESQ'],data['INCOME'])
plt.grid()
plt.show()

2.3 效果呈现

在这里插入图片描述

3、正态资料相关性分析

3.1 使用场景

待分析特征较多。可用它来分析正态分布的两个连续型变量之间的相关性，常用于分析自变量之间，以及自变量与因变量之间的相关性。

3.2 皮尔森相关系数

皮尔森相关系数是反应两个变量之间线性相关程度的统计量。

3.3 代码实现

import numpy as npa = np.random.normal(0,1,100)
b = np.random.normal(2,2,100)
print(stats.pearsonr(a,b))

3.4 结果分析

#(0.10245068885435506, 0.3104404938078574)

ret1：相关系数，其取值范围为[-1,1]。其值接近于1,正相关正读越强，接近于-1,负相关性越强，接近于0，相关性弱。
ret2：p-value：皮尔森相关系数原假设为两组数据不存在相关性。p-value >0.05 接受原假设。

4、非正太资料的相关分析

4.1 使用场景

待分析特征较多，只考虑从变量值的顺序(rank,秩或称等级)，而不考虑变量值的大小，常用于计算有序的类型变量的相关性。可以用于非正太变量的相关性检验，但是它只考虑数据大小的顺序，而不考虑具体的值，导致会丢失部分信息。

4.2 斯皮尔曼等级相关系数

主要用于评价顺序变量间的线性相关关系。

4.3 代码实现

from scipy import stats
import numpy as npa = np.array([1,2,3,4,5])分析
b = np.array([1,6,7,8,20])
print(stats.spearmanr(a,b))

4.4 结果分析

SpearmanrResult(correlation=0.9999999999999999, pvalue=1.4042654220543672e-24)

correlation:相关系数
p-value：原假设为两组数据之间不存在相关性，p-value < 0.05 原假设

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/63323.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

（9）数据分析-相关性分析

文章目录

1、运用场景

2、图形描述相关性

2.1使用场景

2.2 代码实现

2.3 效果呈现

3、正态资料相关性分析

3.1 使用场景

3.2 皮尔森相关系数

3.3 代码实现

3.4 结果分析

4、非正太资料的相关分析

4.1 使用场景

4.2 斯皮尔曼等级相关系数

4.3 代码实现

4.4 结果分析

相关文章

数据分析之数据相关性分析

数据特征分析技能—— 相关性检验

印刷品的排版技巧

微信公众号排版方法及相关素材网站

关于文案排版的一些基本技巧

一些实用排版工具

【工具】用PPT排版打印海报时图片分辨率问题

135编辑器点击换图html,这5种换图姿势，只有排版高手才会！

ChatGLM的搭建过程

道指30只成分股的股价及历史股价抓取分析

短信验证码接口的实现

交友项目【手机号验证码发送】功能实现

免费的短信验证码接口

短信验证码平台有哪些比较好用？

短信验证码的实现

目前可以用的短信验证码平台哪个比较好？

短信验证码登录的实现

低代码真的是“行业毒瘤”？

chatgpt赋能python：Python如何下载人人文库

秘密共享差分隐私原理解析