在做科研写论文的时候,我们总会听说要对数据进行差异性分析,那么何为差异性分析?差异性分析常用的方法有哪些?这些方法应该如何进行分类?如何选择?差异性分析的数据格式是怎么样的?软件如何操作、分析结果如何解读呢?今天我们通过这篇文章,对这些问题一一进行解答。
一、什么是差异性分析?
1、差异性分析
差异性分析主要用于研究两个或多个组别或类别之间的差异。比如分析不同班级数学成绩的差异;不同学历收入水平的差异;不同性别是否吸烟的差异等等。
通过差异性分析,可以确定这些组别或类别之间是否存在差异,以及这些差异是否具有统计学上的意义(p<0.05)。
2、差异关系与相关关系辨析
数据间的关系大概可以分为三类关系:差异关系、相关关系、其它关系(影响关系等)。
大家在分析时,经常会将差异关系和相关关系搞混,它们之间是不同的。二者的区别在于:差异关系中的差异是指不同样本组的某个指标的差异,例如男生和女生的智力差异,涉及到了变量的分组(男&女);相关分析是两个变量之间的关系,和样本分组无关,例如智力和学习成绩是否相关。
搞清楚差异性分析是什么之后,第二步就要选择差异性分析方法了。
二、差异性方法分类
将SPSSAU中的差异性分析方法,按照使用频率、方法类别、统计知识三个不同的角度来看,可以进行不同的分类。如下图:
下面将分别进行说明。
1、使用频率
从使用频率来看,常用的差异性分析方法主要有三大类:t检验、方差分析、卡方检验。
- t检验:用于分析定类数据(仅2组)与定量数据之间的差异性
- 方差分析:用于分析定类数据(2组及以上)与定量数据之间的差异性
- 卡方检验:用于分析定类数据与定类数据之间的差异性
根据数据类型与研究内容的不同,t检验、方差分析、卡方检验可进行细分
(1)t检验
- 单样本t检验:用于分析一组数据与某个数字之间的差异
- 独立样本t检验:用于分析两独立样本数据之间的差异
- 配对样本t检验:用于分析两配对样本数据之间的差异
(2)方差分析
- 单因素方差:自变量X为一个时使用
- 双因素方差:自变量X为两个时使用
- 多因素方差:自变量X个数超过2个时使用
- 事后多重比较:基于方差分析,当X的组别超过2组时,具体对比两两组别之间差异
- 协方差分析:如果研究中有干扰因素(控制变量),使用协方差分析。
- 重复测量方差:当对同一观察单位重复进行多次测量时使用。
(3)卡方检验
- 卡方检验:两类数据与定类数据之间的差异情况
- 配对卡方:两配对定类数据之间的差异情况
- 卡方拟合优度:研究定类数据的实际比例与预期比例是否一致
- 分层卡方:在卡方检验的基础上,进一步考虑分层项的干扰
- Fisher卡方:n<40或期望频数<5时,使用Fisher卡方检验比较合适
2、方法类别
从差异性分析方法类别的角度来看,可将方法分为可视化图形、多选题分析与假设检验方法,这三个类别也可以进行差异性分析。
(1)可视化图形
SPSSAU提供多种可视化分析方法,均可一键生成可视化图形并完成差异性分析:
(2)多选题
当研究问卷中涉及多选题,可能会涉及以下四类分析:多选题单独分析、单选题和多选题交叉、多选题和单选题交叉、多选题和多选题交叉。其中多选题差异性分析中,则涉及到以下三类:
- 单选-多选:单选题与多选题交叉分析
- 多选-单选:多选题与单选题交叉分析
- 多选-多选:多选题与多选题交叉分析
(3)假设检验
上面提到的方差分析、t检验、卡方检验以及下面将提到的非参数检验均属于假设检验的方法。这些方法需要设定原假设和备择假设。原假设通常是假设两个样本或总体之间没有显著差异,而备择假设则是与原假设相反的假设。然后,通过计算检验统计量和对应的p值来判断原假设是否成立。如果p值小于预设的显著性水平(通常为0.05),则拒绝原假设,认为两个样本或总体之间存在显著差异;否则,接受原假设,认为两个样本或总体之间没有显著差异。
3、统计知识
从统计知识角度来看,可将差异性分析方法分为参数检验(如方差分析、t检验)与非参数检验(如卡方检验、秩和检验等)。
- 参数检验:是假定样本总体为某一已知分布的情况下,对总体参数如均值或者方差进行估计和检验的方法。参数检验(方差分析、t检验)一般需要数据满足正态性、方差齐性这两个前提条件。
- 非参数检验:不依赖于样本所来自的总体分布类型,适用范围很广,对样本数据没有要求(不要求正态&方差齐)。
在实际研究中,经常会遇到数据不满足正态性、方差齐等条件的情况,那么此时就可以选择参数检验对应的非参数检验方法进行差异性分析,如下图:
- 单样本wilcoxon检验:检验一组数据与某数字之间的差异
- 配对样本wilcoxon检验:两配对样本数据之间的差异
- Mann-Whitney检验:X组别为2组时使用
- Kruskal-Wallis检验:X组别超过2组时使用
- Friedman检验:多相关样本差异性
- Ridit分析:研究定类数据与定量(等级)数据之间的差异性
选择对应的差异性分析方法后,接下来教大家如何使用SPSSAU快速完成差异性分析。
三、SPSSAU软件操作&结果解读
当前想要研究不同岗位之间婚姻状况(已婚&未婚)是否有显著差异。那么根据我们上面的描述可知,是要分析定类数据与定类数据之间的差异情况,应该选择卡方检验进行差异性分析。
在SPSSAU中【实验/医学研究】模块选择【卡方检验】,将数据拖拽到右侧相应分析框中,点击【开始分析】,操作如下图:
SPSSAU输出卡方检验结果如下:
从上表可以看出:不同岗位样本对于婚姻状况呈现出显著性差异(p<0.05),即说明教师、医生这两种岗位样本的婚姻状况的差异具有统计学意义。具体差异可以通过对比括号内百分比进行描述。也可以查看SPSSAU自动输出的可视化统计学进行对比,如下图:
通过上图可以非常直观地看出,教师中已婚人数占比为40%,明显低于医生中已婚人数占比80%;或者说教师中未婚人数占比60%明显高于医生未婚人数占比20%。