正态分布检验(JB检验和威尔克检验)和斯皮尔曼相关系数(继上回)

正态分布的检验

1,JB检验(n>30)

(1)偏度和峰度

描述函数正不正,高不高的

 

Matlab中计算偏度和峰度的函数是:skewness() 和 kurtosis()

我们以normrnd来生成一个100*1的均值为2,标准差为3的正态分布(这里采用的第一个公式)

得到下面的数据,因为这个是随机生成的样本数据,如果当我我们的样本量变多,就会更加接近0 和 3

 (2)JB的计算

如果Xi是正态分布,而且是再大样本的情况下,那我们就=么就会得到下面的结果

 

(3)下面进行假设检验:

H0:该随机变量服从正态分布   H1:该随机变量不服从正态分布

然后计算该变量的偏度和峰度,得到检验值JB*,并计算出其对应的p值

将p值与0.05比较,如果小于0.05则可拒绝原假设,否则我们不能拒绝原假设。

JB检验只能一列一列的去检验,matlab中是 [h,p]= jbtest(X,α)

α表示显著性水平,一般取0.05,表示95%相信原假设成立,X是向量型变量

下面是代码:

[h,p] = jbtest(Test(:,1),0.05)

下面是循环检验

n_c = size(Test,2); % number of column 数据的列数

H = zeros(1,6); % 初始化节省时间和消耗

P = zeros(1,6);

for i = 1:n_c

[h,p] = jbtest(Test(:,i),0.05);

H(i)=h;

P(i)=p;

end

disp(H)

disp(P)

得出的结果是都是拒绝的原假设

2,(小样本3~50)夏皮洛-威尔克检验

H0:该随机变量符合正态分布

H1:该随机变量不符合正态分布

根据威尔克统计量得出p值,然后和0.05比较

这里尝试运用SPss进行检验

在左上角分析里面的描述统计中的探索可以勾选含检验的正态分布

得到如下的结果

发现p值小于0.05,拒绝原假设

3,Q-Q图

在统计学中,Q-Q图(Q代表分位数Quantile)是一种通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法,

首先选定分位数的对应概率区间集合,在此概率区间上,点(xy)对应于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分

位数。这里,我们选择正态分布和要检验的随机变量,并对其做出QQ图可想而知,如果要检验的随机变量是正态分布,那么QQ图就是一条直线。要利用Q-Q图鉴别样本数据是否近似于正态分布,只需看Q-Q图上的点是否近似地在一条直线附近。

Matlab代码:

% Q-Q图

qqplot(Test(:,1))将Test的第一列和正态分布进行Q-Q图的绘制

(建议是大样本,不然也不会是一个直线)

在这我们使用100的随机生成的正态分布,进行Q-Q检验,发现也不是很满足

正常写论文就是写,我们对xxx进行了xxx检验,我们的假设H0和H1是xxxx得出的p是xxx,如果p>0.05我们不拒绝原来的假设,反之,我们拒绝原假设 这里的假设是满足正态分布

总结:皮尔逊相关系数,首先要检验是否是线性的,然后计算皮尔逊相关系数,如果想要看皮尔逊相关系数是否是显著的,那么就要看其是不是显著的异于0,如果进行 假设检验,就要正态分布的数据,那么我们就要先对其进行正态分布的检验(大样本:JB,小样本:威尔克)

2,斯皮尔曼相关系数

斯皮尔曼相关系数是基于数据的秩次(即排序后的位置)计算的

假设X和Y是两组数据,他们的斯皮尔曼相关系数是

(这里的rs位于(-1,1))

 这里的di是Xi和Yi的等级差

(一个数的等级,就是将它所在的一列数按照从小到大排序后,这个数所在的位置)

根据公式,可以得出斯皮尔曼相关系数

Matlab的用法

下面是代码:

%% 斯皮尔曼相关系数

X = [3 8 4 7 2]' % 一定要是列向量哦,一撇'表示求转置

Y = [5 10 9 10 6]'

% 第一种计算方法

1-6*(1+0.25+0.25+1)/5/24

% 第二种计算方法

coeff = corr(X , Y , 'type' , 'Spearman')

% 等价于:

RX = [2 5 3 4 1]

RY = [1 4.5 3 4.5 2]

R = corrcoef(RX,RY)

% 计算矩阵各列的斯皮尔曼相关系数

R = corr(Test, 'type' , 'Spearman')

斯皮尔曼的假设检验

根据斯皮尔曼等级相关临界值表和我们的样本量,我们可以将我们计算出来的值和表中的值对比

比如n=20, 而且我们置信水平设置的0.95 这个时候查表可得值是0.447,我们计算出来的斯皮尔曼相关系数是0.34,比0.447小,我们无法得出显著的结论,无法拒绝原假设

统计量:

根据我们计算出的斯皮尔曼相关系数表,

我们计算第一排第二列的数据,

Z*=0.0301*sqrt(591-1) =0.731126

P=2*(1-normcdf(0.731126))

得到的p是0.4647,这里的p大于0.05,所以我们不拒绝原假设,

使用matlab计算’

[R,P]=corr(Test, 'type' , 'Spearman')

使用SpSS计算

分析里面的相关的双变量中的斯皮尔曼检验以及双测检验,并且标注相关性

斯皮尔曼相关系数和皮尔逊相关系数选择:

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然spearman相关系数也可以,就是效率没有pearson相关系数高:

2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数

3.两个定序数据之间也用spearman相关系数,不能用pearson相关系数。

定序数据是指仅仅反映观测对象等级、顺序关系的数据,是由定序尺度计量形成的,表现为类别,可以进行排序,属于品质数据。

例如:优、良、差我们可以用1表示优差、2表示良、3表示优,但请注意,用2除以1得出的2并不代表任何含义。定序数据最重要的意义代表了一组数据中的某种逻辑顺序

两个系数(皮尔逊和斯皮尔曼)的关系与差异

关系:当两个变量之间存在严格的线性关系且服从正态分布时,斯皮尔曼相关系数和皮尔逊相关系数的值相等。在一般情况下,如果数据近似正态分布且线性关系明显,两者计算结果也会比较接近。

差异:

数据分布要求皮尔逊相关系数对数据分布要求较高,通常需满足正态分布;而斯皮尔曼相关系数对数据分布没有限制,更具通用性,适用于各种类型的数据分布。

衡量关系类型:皮尔逊相关系数主要衡量线性相关关系;斯皮尔曼相关系数衡量的是单调关系,包括线性和非线性的单调关系。例如,对于变量(Y=X^2),虽然和之间不是线性关系,但它们具有单调递增关系,斯皮尔曼相关系数能反映这种关系,而皮尔逊相关系数可能无法准确反映。

抗干扰能力:由于斯皮尔曼相关系数基于秩次计算,对极端值不敏感,具有较强的抗干扰能力;而皮尔逊相关系数受极端值影响较大,极端值可能会显著改变其计算结果,从而影响对变量相关性的判断。

在实际应用中,应根据数据的特点和研究目的选择合适的相关系数。如果数据满足正态分布且关注线性关系,皮尔逊相关系数是较好的选择;如果数据分布未知或存在极端值,或者关注变量之间的单调关系,斯皮尔曼相关系数更为合适。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4011.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搭建一个基于Spring Boot的书籍学习平台

搭建一个基于Spring Boot的书籍学习平台可以涵盖多个功能模块,例如用户管理、书籍管理、学习进度跟踪、笔记管理、评论和评分等。以下是一个简化的步骤指南,帮助你快速搭建一个基础的书籍学习平台。 — 1. 项目初始化 使用 Spring Initializr 生成一个…

基于Python的心电图报告解析与心电吸引子绘制

一、引言 1.1 研究背景与意义 心脏作为人体的核心器官,其正常电活动对于维持生命活动至关重要。心电图(Electrocardiogram,ECG)作为记录心脏电活动随时间变化的重要工具,能够直观反映心脏的节律、传导等功能状态&…

【大数据】机器学习------支持向量机(SVM)

支持向量机的基本概念和数学公式: 1. 线性可分的支持向量机 对于线性可分的数据集 ,其中(x_i \in R^d) 是特征向量 是类别标签,目标是找到一个超平面 ,使得对于所有 的样本 ,对于所有(y_i -1) 的样本,…

左神算法基础提升--4

文章目录 树形dp问题Morris遍历 树形dp问题 求解这个问题需要用到我们在基础班上学到的从节点的左子树和右子树上拿信息的方法。 求最大距离主要分为两种情况:1.当前节点参与最大距离的求解;2.当前节点不参与最大距离的求解; 1.当前节点参与最…

53,【3】BUUCTF WEB october 2019 Twice SQLinjection

题目得到信息,2次注入,进入靶场 登录页面,很自然想到SQL 第一次注入应该是这个可以登录,注册,提交简介的页面 第二次注入应该是在info处注入,信息显示在简介处 我真的纯脑子有病,人家二次注入不…

python编程-OpenCV(图像读写-图像处理-图像滤波-角点检测-边缘检测)图像变换

形态变换 图像处理中的形态学操作是处理图像结构的有效方法。以下是一些常见的形态学操作的介绍及其在 OpenCV 中的实现示例。 1. 腐蚀(Erosion) 腐蚀操作通过消除图像边界来减少图像中的白色区域(前景),使物体的边…

Spring Boot + Apache POI 实现 Excel 导出:BOM物料清单生成器(支持中文文件名、样式美化、数据合并)

目录 引言 Apache POI操作Excel的实用技巧 1.合并单元格操作 2.设置单元格样式 1. 创建样式对象 2. 设置边框 3. 设置底色 4. 设置对齐方式 5. 设置字体样式 6.设置自动换行 7. 应用样式到单元格 3. 定位和操作指定单元格 4.实现标签-值的形式 5.列宽设置 1. 设…

python(25) : 含有大模型生成的公式的文本渲染成图片并生成word文档(支持flask接口调用)

公式样例 渲染前 \[ \sqrt{1904.615384} \approx 43.64 \] 渲染后 安装依赖 pip install matplotlib -i https://mirrors.aliyun.com/pypi/simple/ requestspip install sympy -i https://mirrors.aliyun.com/pypi/simple/ requestspip install python-docx -i https…

基于32QAM的载波同步和定时同步性能仿真,包括Costas环的gardner环

目录 1.算法仿真效果 2.算法涉及理论知识概要 3.MATLAB核心程序 4.完整算法代码文件获得 1.算法仿真效果 matlab2022a仿真结果如下(完整代码运行后无水印): 仿真操作步骤可参考程序配套的操作视频。 2.算法涉及理论知识概要 载波同步是…

ARP Check

ARP Check所解决的问题 ARP Check主要用于解决ARP欺骗的问题,依赖于DHCP SnoopingIP Source Guard或者是端口安全全局地址绑定来达到防止ARP欺骗的作用 一旦在端口下配置了ARP Check功能,那么如果不是表项中所对应的IPMAC或是IP的话,就会拒…

通信协议之多摩川编码器协议

前言 学习永无止境!本篇是通信协议之多摩川编码器协议,主要介绍RS485硬件层以及软件层帧格式。 注:本文章为学习笔记,部分图片与文字来源于网络/应用手册,如侵权请联系!谢谢! 一、多摩川协议概述…

Web前端第一次作业

主页代码&#xff1a; <!DOCTYPE html> <html lang"zh"> <head> <meta charset"UTF-8"> <meta name"viewport" content"widthdevice-width, initial-scale1.0"> <title>主页</title> …

力扣动态规划-2【算法学习day.96】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向&#xff08;例如想要掌握基础用法&#xff0c;该刷哪些题&#xff1f;建议灵神的题单和代码随想录&#xff09;和记录自己的学习过程&#xff0c;我的解析也不会做的非常详细&#xff0c;只会提供思路和一些关…

LINUX 内核设计于实现 阅读记录(2025.01.14)

文章目录 一、内核历史1、内核简介2、LINUX 内核与 UNIX 内核比较3、LINUX内核版本命名 二、从内核出发1、获取内核源码&#xff08;1&#xff09;查看Linux内核版本 uname -r&#xff08;2&#xff09;下载源码 https://www.kernel.org/&#xff08;3&#xff09;编译内核 2、…

Phi小模型开发教程:用C#开发本地部署AI聊天工具,只需CPU,不需要GPU,3G内存就可以运行,不输GPT-3.5

大家好&#xff0c;我是编程乐趣。 行业诸多大佬一直在说&#xff1a;“‌2025年将是AI应用元年‌”&#xff0c;虽然说大佬的说法不一定对&#xff0c;但AI趋势肯定没错的。 对于我们程序员来说&#xff0c;储备AI应用开发技能&#xff0c;不管对找工作、接项目、创业肯定是…

Android系统开发(一):AOSP 架构全解析:开源拥抱安卓未来

引言 当我们手握智能手机&#xff0c;流畅地滑动屏幕、切换应用、欣赏动画时&#xff0c;背后其实藏着一套庞大且精密的开源系统——Android AOSP&#xff08;Android Open Source Project&#xff09;。这套系统不仅是所有安卓设备的根基&#xff0c;也是系统开发者的终极 pl…

【机器学习实战入门】基于深度学习的乳腺癌分类

什么是深度学习&#xff1f; 作为对机器学习的一种深入方法&#xff0c;深度学习受到了人类大脑和其生物神经网络的启发。它包括深层神经网络、递归神经网络、卷积神经网络和深度信念网络等架构&#xff0c;这些架构由多层组成&#xff0c;数据必须通过这些层才能最终产生输出。…

ASP .NET Core 学习(.NET9)配置接口访问路由

新创建的 ASP .NET Core Web API项目中Controller进行请求时&#xff0c;是在地址:端口/Controller名称进行访问的&#xff0c;这个时候Controller的默认路由配置如下 访问接口时&#xff0c;是通过请求方法&#xff08;GET、Post、Put、Delete&#xff09;进行接口区分的&…

TextButton组件的功能与用法

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了CircleAvatar Widget,本章回中将介绍Button这种Widget&#xff0c;闲话休提&#xff0c;让我们一起Talk Flutter吧。 1 概念介绍 关于Button相信大家都很熟悉&#xff0c;也就是我们常用的按钮。用户按下按钮后…

3. 后端验证前端Token

书接上回&#xff0c;后端将token返回给前端&#xff0c;前端存入cookie&#xff0c;每次前端给后端发送请求&#xff0c;后端是如何验证的。 若依是用过滤器来实现对请求的验证&#xff0c;过滤器的简单理解是每次发送请求的时候先发送给过滤器执行逻辑判断以及处理&#xff0…