SPSS|正负偏态的转换方法|限值1.96|反转后处理(对数法)|正态得分法|实战小练-SPSS学习(2)

目录

  • 学习目的
  • 软件版本
  • 参考文档
  • 基础数据
  • 正负偏态的转换方法(引自《小白爱上SPSS》)
    • 正偏态数据转换方法
    • 负偏态数据转换
  • 实战
    • 数据准备
    • 数据初探
    • 输出结果分析
      • 查看峰度、偏度
      • 查看峰度标准误差、偏度标准误差
      • 计算偏度系数和峰度系数
      • Tips:为什么判断限值是1.96?
      • 样本量过大的情形
      • 正态性检验结果
        • 结果解读
  • 正负偏态的转换
    • 选择检验方法和操作步骤
      • Step1:反转
      • Step2: 反转后处理(以对数转换为例)
    • 反转后数据再探索
    • 正态得分方法
    • 正态得分法的缺点
  • 重点回顾

学习目的

利用SPSS,将非正态分布数据转换为正态分布。

软件版本

IBM SPSS Statistics 26。

参考文档

《小白爱上SPSS》课程

基础数据

《小白爱上SPSS》课程中的加餐原始数据。
在这里插入图片描述

正负偏态的转换方法(引自《小白爱上SPSS》)

正态分布转换方法有很多,比如:对数变换、平方根变换、平方根反正弦变换、平方变换、倒数变换、Box-Cox变换、正态得分法。
这里选择几种常用方法讲解,起示范作用。数据转换分成两种情况,一种是正偏态数据,另一种是负偏态数据,每种又分成轻度、中度和严重三种情况。

正偏态数据转换方法

  • 1、轻度正偏态分布
    当偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,故考虑对变量x取根号开平方的方法来进行转换。
    SPSS语句如下:
    COMPUTE x_new = SQRT(x)
    (SQRT为开平方根Square Root缩写)
  • 2、中度正偏态分布
    当偏度值>0,偏度值为其标准误差的3倍以上时,即Z-score>3,此时认为资料分布呈现中度的正偏态分布,可以考虑对变量x取对数来进行转换。可以取自然对数(ln)或以10为底的对数(log10)。
    SPSS语句如下:
    COMPUTE x_new = LN(x)
    COMPUTE x_new = LG10(x)
    注意:LG10的纠正力度较强,有时甚至会矫枉过正,将正偏态转换为负偏态,因此在进行正态转换后一定要对该变量再次进行正态性检验。
  • 3、重度正偏态分布
    对于两端波动比较大的数据资料,极端值可能产生较大的影响,此时可以考虑取倒数的方法来进行转换。
    SPSS语句如下:
    COMPUTE x_new = 1/x
    若你不太熟悉SPSS语法编辑窗口,则可通过SPSS中“转换”—“计算变量”实现,找到sqrt, ln, lg10等函数。
    注意:根号下要求数据均为非负数(即≥0),对数要求数据均为正数(即>0);取倒数要求分母不为0, 如果变量x中出现上述情况,则需要先将其进行一定的转换,如x+K或K-x,再对其取根号、对数或倒数。其中K为一个常数,可以根据需要进行赋值,例如赋值为1,或取数据的最小值、最大值等。

负偏态数据转换

对于负偏态分布的数据资料,首先需要将负偏态资料进行反转,转换为正偏态,然后再参考正偏态分布资料的转换方法进行转换。
反转的方法:首先找出该数据系列的最大值max,用最大值+1,再减去每个数值。

  • 1、轻度负偏态分布
    SPSS语句如下:
    COMPUTE x_new = SQRT(max+1-x)
  • 2、中度负偏态分布
    SPSS语句如下:
    COMPUTE x_new = LN(max+1-x)
    COMPUTE x_new = LG10(max+1-x)
  • 3、重度负偏态分布
    SPSS语句如下:
    COMPUTE x_new = 1/(max+1-x)

实战

42名员工的月收入,试检验其正态性。若不服从正态性,请将其转化为正态分布。

数据准备

输入SPSS中,可选择excel文件导入,导入后数据如下:
在这里插入图片描述

数据初探

完成数据输入后,在主界面依次点击:分析-描述统计-探索:
在这里插入图片描述
在这里插入图片描述
将“原始收入数据”选入因变量列表,点击 图 --勾选直方图–勾选含检验的正态图–继续–确定。
在这里插入图片描述

输出结果分析

查看峰度、偏度

在这里插入图片描述

查看峰度标准误差、偏度标准误差

这里要通过频率选项:
在这里插入图片描述
频率中,将原始收入数据加入“变量”,选择“统计”,显示频率表选项可按需勾选:
在这里插入图片描述
统计中的选项:
在这里插入图片描述
选中后验分布中的偏度,峰度,按继续-确定,输出频率统计表:
在这里插入图片描述

计算偏度系数和峰度系数

偏度系数
在这里插入图片描述
峰度系数
在这里插入图片描述
由计算结果,偏度系数和峰度系数的绝对值均大于1.96,可以认为该组样本数据不服从符合正态分布。

Tips:为什么判断限值是1.96?

概念引自百度百科:标准正态分布。
标准正态分布(英语:standard normal distribution, 德语Standardnormalverteilung),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。
标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。
标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。
在这里插入图片描述
查标准正态分布表,当α=0.05时,进行区间估计,两侧分别是0.05/2=0.025,查标准正态分布表时找到0.975,对应的Z值就是1.96。所以偏度系数和峰度系数的绝对值的判断限值是1.96。

样本量过大的情形

注意:当样本量过大(超过100)时,采用峰度和偏度系数会对正态性的情况有所偏误,此时,可以直接尝试采用图示法(直方图、P-P、Q-Q)的方法进行检验会更直观。

正态性检验结果

在这里插入图片描述

结果解读

当数据量≤50时,倾向于以夏皮洛-威尔克(S-W)检验结果为准;
当数据量>50时,倾向以柯尔莫戈洛夫-斯米诺夫(K-S)检验结果为准;
当数据量>5000时,SPSS只会显示K-S检验结果。
本例中,我们检验42名员工收入的正态分布情况,由上表显示,样本量(可参考自由度那一列数值)小于50,故以夏皮洛-威尔克(S-W)检验结果为准。检验的p值(即显著性那一列)为0.000,小于0.05,说明42名员工收入不符合正态分布,故认为收入不满足正态性。

正负偏态的转换

选择检验方法和操作步骤

由上可知,因本案例中偏度值(-1.266)<0,为负偏态,偏度值为其标准误差的3倍以上(偏度系数Z=3.468>3),故考虑对变量x取对数来进行转换。
对于负偏态分布的数据资料,首先需要将负偏态资料进行反转,转换为正偏态,然后再参考正偏态分布资料的转换方法进行转换。

Step1:反转

方法为:首先找出该数据系列的最大值max,用最大值+1,再减去每个数值,本例子中最大值为15510,处理后数据名称为“反转后数据”,数据处理如下:
在描述表格中找到最大值:
在这里插入图片描述
添加计算变量,生成新的列:
在这里插入图片描述
新列命名为“反转的列”:
在这里插入图片描述
生成结果如下:
在这里插入图片描述

Step2: 反转后处理(以对数转换为例)

根据前述说明,数据按中度正偏态(对数转换)处理。
对反转后数据进行对数转换,以Log10为例,步骤如下:
(1) 选择转换→ 计算变量;
(2) 在目标变量(T)框中输入一个新的变量名,作为数据转换后的变量名,此处设定为新收入数据;
在这里插入图片描述
(3) 在函数组中选择算数,在函数和特殊变量中双击Lg10,此时在数字表达式框中显示LG10(?);
(4) 从变量列表中双击反转后数据,此时在数字表达式框中显示LG10(反转数据)。
(5) 点击确定完成操作,操作完成,出现新收入数据列。
在这里插入图片描述
重新执行数据探索。

反转后数据再探索

输出描述:
在这里插入图片描述
正态性检验:
在这里插入图片描述
在结果输出的描述表格中显示,计算偏度系数(.329/.365=9.014)和峰度系数(12.126/.717=16.912)均大于1.96,正态性检验p(0.000)<0.001,故说明转换后数据仍不服从正态分布(读者可以采用【倒数】转换方法尝试下,结果仍然不服从正态分布)。
至此,原作者建议不再进行正态分布数据转换尝试,而采用非参数检验方法。
因为,一般而言,收入这个变量的总体数据是不服从正态分布的。

正态得分方法

当然,我们也可采用正态得分方法操作,使其转换为正态分布。
选择转换→个案排秩检验:
在这里插入图片描述
将收入选入变量(V)框中点击类型排秩选项框,取消默认勾选的秩,勾选正态得分选项。在比例估算公式下有4种方法可供选择,默认Blom方法,其他方法也可以进行尝试,点击继续再点击确定完成操作。
在这里插入图片描述
我们可以看到在程序运行后在变量列表中多出了一个名为N原始的新变量,即为计算的正态得分。
在这里插入图片描述
下图为采用探索方法对N原始收入数据正态性检验以验证转化效果。
在结果输出的描述表格中显示,偏度系数和峰度系数均小于1.96,正态性检验p=1.000>0.05,故说明转换后数据服从正态分布。
在这里插入图片描述
图示也能看到比较明显的正态分布特征:
在这里插入图片描述

正态得分法的缺点

需要注意:基于正态得分法得到的数据,在编秩过程中额外地加入原本不属于数据本身的分布特征,因此在一般统计方法中,并不能直接当做正态数据使用,其标准差、方差等信息与原始数据的计算结果也并不一样。这种转换,仅能用作在构建复杂模型时的探索。

重点回顾

(1)正态分布转换方法有很多,包括:对数变换、平方根变换、平方根反正弦变换、平方变换、倒数变换、Box-Cox变换(SPSS软件实现不了)和正态得分法等。
(2)不是任何非正态数据都可以进行正态转换,只有把握认为数据的总体分布是正态的时候才可做正态转换。
(3)如果一种正态分布转换方法没成功,则需要多次其他转换方法,甚至要创造性提出转换方法,从中选择效果较好者。
(4)如果通过多次变量转换的方法依然无法转换成功,就不再适用于T检验、方差分析等方法了,这时可采用前期介绍过的非参数检验的方法来进行分析,例如Wilcoxon检验和Mann-Whitney U检验方法等。
(5)在对线性回归模型进行解释时,如果使用函数转换的方法对变量进行转换,则应对转换后的变量给予解释,或者可以根据转换时使用的函数关系,倒推原始自变量对原始因变量的效应大小。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/163888.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3 + Nodejs 实战 ,文件上传项目--大文件分片上传+断点续传

目录 1.大文件上传的场景 2.前端实现 2.1 对文件进行分片 2.2 生成hash值&#xff08;唯一标识&#xff09; 2.3 发送上传文件请求 3.后端实现 3.1 接收分片数据临时存储 3.2 合并分片 4.完成段点续传 4.1修改后端 4.2 修改前端 5.测试 博客主页&#xff1a;専心_前端…

JS初步了解环境对象this

什么是环境对象&#xff1f; 环境对象&#xff1a;指的是函数内部特殊的变量this&#xff0c;它代表着当前函数运行时所处的环境 **作用&#xff1a;**弄清楚this的指向&#xff0c;可以让我们代码更简洁 在普通函数中&#xff1a; // 每个函数里面都有this 普通函数的this指向…

计网----数据包在传输中的变化过程,单播组播和广播,APR协议,APR代理,免费ARP,DNS协议,路由数据转发过程

计网----数据包在传输中的变化过程&#xff0c;单播组播和广播&#xff0c;ARP协议&#xff0c;ARP代理&#xff0c;免费ARP&#xff0c;DNS协议&#xff0c;路由数据转发过程 一.数据包在传输中的变化过程&#xff08;在同一个路由器下&#xff09; 1.传输数据时&#xff0c…

怎么使用LightPicture开源搭建图片管理系统并远程访问?【搭建私人图床】

文章目录 1.前言2. Lightpicture网站搭建2.1. Lightpicture下载和安装2.2. Lightpicture网页测试2.3.cpolar的安装和注册 3.本地网页发布3.1.Cpolar云端设置3.2.Cpolar本地设置 4.公网访问测试5.结语 1.前言 现在的手机越来越先进&#xff0c;功能也越来越多&#xff0c;而手机…

根据SpringBoot Guides完成进行示例学习(详细步骤)

目录 1.打开Spring | Guides官网&#xff0c;或者直接搜索springboot都可 2.选择要学习的内容 3.根据提示的网址&#xff0c;Git到本地 4.将文件用IDEA打开&#xff0c;根据教程完成示例&#xff0c;这里不做细致讲解 5.运行项目 6.在终端查看运行结果 以Scheduling Task…

Unity之ShaderGraph如何实现马赛克效果

前言 今天我们来实现一个马赛克的效果 如下所示&#xff1a; 关键节点 Posterize&#xff1a;色调分离节点 图像的色调分离或色调分离需要将色调的连续渐变转换为色调较少的几个区域&#xff0c;并从一种色调突然改变为另一种色调。 原理 原理就是通过色调分离节点&…

微服务负载均衡实践

概述 本文介绍微服务的服务调用和负载均衡&#xff0c;使用spring cloud的loadbalancer及openfeign两种技术来实现。 本文的操作是在微服务的初步使用的基础上进行。 环境说明 jdk1.8 maven3.6.3 mysql8 spring cloud2021.0.8 spring boot2.7.12 idea2022 步骤 改造Eu…

中文编程开发语言工具开发案例:多种称重方式编程实际例子

中文编程开发语言工具开发案例&#xff1a;多种称重方式编程实际例子 上图为 计价秤&#xff0c;使用串口通讯线连接电脑的主机&#xff0c;软件自动读取称的重量&#xff0c;自动计算金额。这种方式称重快速&#xff0c;不需再打印条码。 上图这个称重方式为 一体称称重&#…

ES6(ECMAScript 2015)有哪些新属性,如何判断当前浏览器是否支持?

ES6&#xff08;ECMAScript 2015&#xff09;引入了许多新的语法和特性&#xff0c;以增强 JavaScript 编程语言的功能。以下是一些常见的 ES6 语法和特性以及它们的解释&#xff1a; let 和 const 声明&#xff1a; let 和 const 用于声明变量&#xff0c;代替了旧的 var 关键…

Kubernetes基础概念及架构和组件

目录 一、kubernetes简介 1、kubernetes的介绍与作用 2、为什么要用K8S&#xff1f; 二、kubernetes特性 1、自我修复 2、弹性伸缩 3、服务发现和负载均衡 4、自动发布&#xff08;滚动发布/更新&#xff09;和回滚 5、集中化配置管理和密钥管理 6、存储编排 7、任务批…

虚拟音频设备软件 Loopback mac中文版软件介绍

创建虚拟音频设备以从应用程序和音频输入设备获取声音&#xff0c;然后将其发送到音频处理应用程序&#xff0c;它就是—Loopback for Mac&#xff0c;Loopback mac为您提供高端工作室混音板的强大功能&#xff0c;有了它在Mac上传递音频会变得很容易。 Loopback for mac中文版…

Qt ModelViewDelegate(模型-视图-代理) 介绍和使用

一、Model (模型) 介绍 Qt Model 是 Qt 的一个重要组件&#xff0c;用于管理和展示数据。它是 Qt 的 Model/View 架构的核心部分&#xff0c;用于将数据模型与其视图相分离&#xff0c;实现数据的高效处理和可视化呈现。 Qt Model 可以理解成一组数据结构&#xff0c;其中包含…

什么是软件测试? 软件测试都有什么岗位 ?软件测试和调试的区别? 软件测试和开发的区别?软件测试等相关概念入门篇

1、什么是软件测试&#xff1f; 常见理解&#xff1a; 软件测试就是找BUG&#xff0c;发现缺陷 真正理解&#xff1a; 软件测试就是验证软件产品特性是否满足用户的需求 测试定义&#xff1a; 测试人员验证软件是否符合需求的这个过程就是测试 2、为什么要有测试 标准情况下&a…

【Linux学习笔记】代码编辑工具vim

1. vim工具基本模式的转换2. vim命令模式下的各种编辑命令2.1. 光标行定位2.2. 光标自由定位2.3. 复制粘贴2.4. 删除2.5. 文本的大小写替换2.6. 文本的替换2.7. 文本的前删后删2.8. 撤销操作 3. vim底行模式下的命令3.1. 设置行号与取消设置行号3.2. 分屏操作3.3. 在不退出vim的…

Openssl数据安全传输平台003:Protobuf - 部署

文章目录 一、Windows环境二、Linux Centos环境三、protobuf测试3.1 新建.proto文件生成相应的类3.2 .proto生成相应的类的使用3.3 配置VS3.4 test代码 一、Windows环境 在windows下配置&#xff0c;无论protobuf是什么版本&#xff0c;IDE和编译器的版本都要保持一致。 比如…

ESP32出现喂狗失败处理办法

前言 &#xff08;1&#xff09;今天在使用ESP32S3的时候&#xff0c;做移植测试的时候&#xff0c;不知道为什么出现了看门狗报错。简单查了一下&#xff0c;测试发现是任务阻塞导致的。 报错 &#xff08;1&#xff09;报错信息如下&#xff1a; <1>E (5368) task_wdt:…

大数据Flink(九十九):SQL 函数的解析顺序和系统内置函数

文章目录 SQL 函数的解析顺序和系统内置函数 一、​​​​​​​SQL 函数

oracle 表空间详解以及配置操作

Oracle 数据库是由若干个表空间构成的。任何数据库对象在存储时都必须存储在某个 表空间中。表空间对应于若干个数据文件&#xff0c;即表空间是由一个或多个数据文件构成的。 1、常用表空间&#xff1a; 系统表空间 (system tablespace) 是每个 Oracle 数据库都必须具备的。…

Hadoop3教程(二十三):Yarn的三大调度器

文章目录 &#xff08;129&#xff09;FIFO调度器&#xff08;130&#xff09;容量调度器特点资源分配算法 &#xff08;131&#xff09;公平调度器特点缺额的定义队列资源分配方式基于FIFO策略基于Fair策略资源分配算法 DRF策略 参考文献 &#xff08;129&#xff09;FIFO调度…

博客系统中的加盐算法

目录 一、为什么要对密码进行加盐加密&#xff1f; 1、明文 2、传统的 MD5 二、加盐加密 1、加盐算法实现思路 2、加盐算法解密思路 3、加盐算法代码实现 三、使用 Spring Security 加盐 1、引入 Spring Security 框架 2、排除 Spring Security 的自动加载 3、调用 S…