1. 正态分布检验
2. 统计检验
t-test: 适用于样本数量较小(通常小于 30)的正态分布数据,用于比较两个样本的均值是否有显著差异。
Paired t-test: 确定某个总体的成对测量值之间的差异是否为 0
Two-sample t-test (independent t-test): 确定两个不同组的总体均值是否相等
One-sample t-test: 确定总体均值是否等于特定的值
ANOVA: 用于比较两个或多个组之间的均值是否存在差异,可以分为单因素 ANOVA 和多因素 ANOVA,其主要区别在于所考虑的因素数量不同。
单因素ANOVA(One way ANOVA):只考虑一个因素对因变量的影响,该因素通常是分类变量。例如,研究人员想要比较不同品牌的汽车销售量是否有显著差异,销售量是因变量,汽车品牌是分类变量,这就是一个单因素 ANOVA。
多因素 ANOVA (Two-way Analysis of Variance / N-way Analysis of Variance):其中 "Two-way" 表示有两个因素,"N-way" 则表示有 N 个因素。在实际应用中,多因素 ANOVA 还可以根据研究设计的具体情况分为三因素、四因素甚至更多因素的情况。
Wilcoxon test:
Wilcoxon rank-sum test: 一种非参数假设检验方法,用于比较两个独立样本的中位数是否存在显著差异。它适用于两个样本大小相等或不等、来自不同总体、不满足正态分布假设的情况。
Wilcoxon rank-sum test 的基本思路是将两个样本合并在一起,对所有的观测值按大小排序,并对每个样本中的观测值进行排名。然后,将样本中的排名之和相加,得到一个总的排名和,用于计算 U 统计量。U 统计量表示较小的样本中的排名和,它可以用于判断两个样本的中位数是否存在显著差异。通过比较 U 统计量和临界值,可以得出显著性检验的结果。
Wilcoxon rank-sum test 的优点是不需要假设数据满足正态分布,可以用于比较偏态分布或异常值较多的数据;缺点是当样本量较小或两个样本的方差不相等时,其功效可能较低。
Wilcoxon signed-rank test: 一种非参数假设检验方法,用于比较两个相关样本的中位数是否存在显著差异。它适用于数据不满足正态分布假设,样本量较小,且数据没有明显的异常值。
Wilcoxon signed-rank test 的基本思路是将两个相关样本的差值进行排序,然后对每个差值的绝对值排名。然后,将排名之和相加,得到一个总的排名和,用于计算 W 统计量。W 统计量表示正值差值的排名和,可以用于判断两个样本的中位数是否存在显著差异。通过比较 W 统计量和临界值,可以得出显著性检验的结果。
Wilcoxon signed-rank test 的优点是可以处理数据不满足正态分布假设的情况,适用于小样本情况,对异常值不敏感;缺点是对数据的分布形态有一定的要求,只能用于比较两个相关样本的中位数,不能用于比较两个独立样本。
Kruskal-Wallis test: 一种非参数假设检验方法,用于比较三个或三个以上独立样本的中位数是否存在显著差异。它适用于数据不满足正态分布假设,样本量较小,且数据没有明显的异常值。
Kruskal-Wallis test 的基本思路是将所有样本的观测值合并,然后将它们从小到大排序,并分别计算每个样本中位数的排名。然后,计算每个样本排名之和,并用于计算 H 统计量。H 统计量是一个标准化的排名和,可以用于判断多个样本的中位数是否存在显著差异。通过比较 H 统计量和临界值,可以得出显著性检验的结果。
Kruskal-Wallis test 的优点是可以处理数据不满足正态分布假设的情况,适用于小样本情况,对异常值不敏感;缺点是只能用于比较多个独立样本的中位数,不能用于比较相关样本的中位数。