Z 检验和 T 检验之间的区别

目录

一、说明

二、什么是假设检验?

三、假设检验基础

3.1 假设检验的基本概念

3.2 、执行假设验证的步骤

3.3 临界值、P 值

3.4 方向假设

3.5 非方向假设检验s

四、什么是 Z 检验统计量?

五、Z 检验示例

5.1 单样本 Z 检验

5.2 双样本 Z 检验

六、什么是 T 检验?

6.1 单样本 T 检验示例

6.2 双样本 T 检验

七、在 z 检验和 t 检验之间做出决定

八、Z 检验 vs T 检验

九、结论


一、说明

        冠状病毒大流行使我们所有人都成为了一名统计学家。我们不断检查数字,对大流行病将如何发展做出自己的假设,并就“高峰”何时发生提出假设。不仅仅是我们在进行假设构建——媒体也在此蓬勃发展。在这种统计探索中,了解 Z 检验与 T 检验的差异变得至关重要。这些测试是统计学家的宝贵工具,使他们能够得出有意义的结论并根据手头的数据做出明智的决定。因此,在本文中,您将全面了解 z test 与 t test 的区别,现在选择哪个。

        几天前,我读到一篇新闻文章,其中提到这次疫情“可能是季节性的”,并在温暖的条件下缓解:

        所以我开始想知道——关于冠状病毒,我们还能假设什么呢?成年人是否更容易受到冠状病毒爆发的影响?相对湿度如何影响病毒的传播?支持这些说法的证据是什么?我们如何检验这些假设?作为一个统计学爱好者,所有这些问题都挖掘了我对假设检验基础知识的旧知识。在本文中,我们将讨论假设检验的概念以及 z 检验和 t 检验之间的区别。然后,我们将使用 COVID-19 案例研究来结束我们的假设检验学习。

        此外,在本文中,您将简要概述 Z 测试、它的示例、那是什么以及 z 测试与 t 测试之间的比较。

学习目标

  1. 了解假设检验的基础知识
  2. 了解假设检验的工作原理
  3. 能够区分 z 检验、t 检验和其他统计概念

二、什么是假设检验?

        假设检验提供了一种根据数据样本对总体进行推断的方法,从而有助于数据分析。它允许分析师根据样本数据提供的证据来决定是接受还是拒绝有关总体的给定假设或假设。例如,假设检验可以确定样本均值是否与假设的总体均值显著不同,或者样本比率是否与假设的总体比率存在显著差异。此信息有助于决定是接受还是拒绝有关总体的给定假设或假设。在统计分析中,假设检验根据数据样本对总体进行推断。

        在机器学习中,假设检验评估模型的性能并确定其参数的重要性。例如,t 检验或 z 检验比较两个数据组的均值,以确定它们之间是否存在显著差异。使用此信息改进模型,或选择最佳特征集。此外,假设检验可以评估模型的准确性并决定如何继续进行进一步开发或部署。我们甚至可以使用假设检验过程在给定数据集上测试机器学习算法(如线性回归和逻辑回归)的统计有效性。

        这个关于假设检验的广泛教程是您开始学习该主题所需的内容。

三、假设检验基础

        让我们举个例子来理解假设检验的概念。一个人因刑事犯罪受审,法官需要对他的案件做出裁决。现在,在这种情况下,有四种可能的组合:

  • 第一个案件:这个人是无辜的,法官认定这个人是无辜的
  • 第二个案件:这个人是无辜的,法官认定这个人有罪
  • 第三种情况:此人有罪,法官认定此人无辜
  • 第四种情况:此人有罪,法官认定此人有罪

        正如你清楚地看到的,判决中可以有两种类型的错误——类型 1 错误,当判决对这个人不利时,他是无辜的,以及类型 2 错误,当判决对这个人有利时,他有罪。

        根据无罪推定,在被证明有罪之前,该人被认为是无辜的。这意味着法官必须找到使他“排除合理怀疑”的证据。这种“排除合理怀疑”的现象可以理解为概率(法官判定有罪 |Person is Innocent)应该较小。

3.1 假设检验的基本概念

        我们认为零假设是正确的,直到我们找到反对它的有力证据。然后我们接受备择假设。我们还确定了显著性水平 (⍺),它可以理解为(法官判定有罪 |Person 是 Innocent的)。因此,如果 ⍺ 更小,则需要更多证据来否定原假设。不用担心;我们稍后将使用案例研究来介绍所有这些。

3.2 、执行假设验证的步骤

        执行假设验证检验有四个步骤:

  1. 设置 Null 假设和替代假设
  2. 设置决策的 Significance Level, Criteria
  3. 计算检验统计量
  4. 做出决定

        必须注意的是,z-检验和t-检验是参数测试,这意味着零假设是关于一个总体参数,该参数小于、大于或等于某个值。第 1 步到第 3 步是不言自明的,但是我们可以根据什么来做出第 4 步的决定呢?这个 p 值表示什么?

        我们可以将这个 p 值理解为辩护律师论点的度量。如果 p 值小于 ⍺ ,则拒绝原假设,如果 p 值大于 ⍺,则无法拒绝原假设。

3.3 临界值、P 值

        让我们用 Normal Distribution 的图形表示来理解 Hypothesis Testing 的逻辑。

        上述可视化有助于了解 z 值及其与临界值的关系。通常,我们将显著性水平设置为 10%、5% 或 1%。如果我们的测试分数位于接受区,则我们无法拒绝 Null 假设。如果我们的检验分数位于临界区域,则拒绝原假设并接受替代假设。

Critical Value 是 Acceptance Zone 和 Rejection Zone 之间的截止值。我们将测试分数与临界值进行比较,如果测试分数大于临界值,则意味着我们的测试分数位于拒绝区,我们拒绝原假设。另一方面,如果测试分数低于临界值,则意味着测试分数位于接受区域,我们无法拒绝零假设。

        但是,当我们可以根据测试分数和临界值拒绝/接受假设时,为什么还需要 p 值呢?

        P 值的好处是,我们只需要一个值来做出有关假设的决策。我们不需要计算两个不同的值,例如临界值和测试分数。使用 p 值的另一个好处是,我们可以通过直接将 p 值与显著性水平进行比较,在任何所需的显著性水平上进行测试。

        这样,我们就不需要计算每个显著性水平的检验分数和临界值。我们可以得到 p 值,并直接将其与我们感兴趣的显著性水平进行比较。

3.4 方向假设

        在方向假设中,如果检验分数太大(对于右尾)或太小(对于左尾),则拒绝原假设。因此,这种测试的排斥区由一部分组成,对于右尾测试,该部分位于右侧;或者在左尾测试的情况下,拒绝区域位于中心的左侧。

3.5 非方向假设检验s

在非方向假设检验中,如果检验分数太小或太大,则原假设将被拒绝。因此,这种测试的排斥区由两部分组成:一部分在左侧,一部分在右侧。这是一个双尾测试的情况。

四、什么是 Z 检验统计量?

z 检验是检验 Null 假设的一种统计方法,当:

  • 我们知道总体方差,或者
  • 我们不知道总体方差,但我们的样本量很大 n ≥ 30

如果样本量小于 30 并且不知道总体方差,则必须使用 t 检验。这就是我们判断何时使用 z 检验与 t 检验的方式。此外,还假设 z 统计量服从标准正态分布。相反,t 统计量服从自由度等于 n-1 的 t 分布,其中 n 是样本数量。

必须注意,用于 z 检验或 t 检验的样本必须是独立样本,并且还必须具有与总体分布相同的分布。这确保了样本不会“偏向”于/反对我们想要验证/失效的原假设。

五、Z 检验示例

5.1 单样本 Z 检验

        当我们想要将样本均值与总体均值进行比较时,我们执行单样本 z 检验。


        下面是一个理解单样本 z 检验的示例

        假设我们需要确定女孩在考试中的平均分数是否高于 600。我们有信息表明女孩分数的标准差是 100。因此,我们使用随机样本收集了 20 名女孩的数据并记录了她们的分数。最后,我们还将 ⍺ 值(显著性水平)设置为 0.05。

在此示例中:

  • 女孩的平均分数是 641
  • 样本中的数据点数为 20
  • 总体平均值为 600
  • 总体的标准差为 100

由于 P 值小于 0.05,我们可以否定原假设,并根据我们的结果得出 Girls 的平均得分高于 600 的结论。

5.2 双样本 Z 检验

当我们想要比较两个样本的均值时,我们执行双样本 z 检验。

下面是一个示例,用于了解双样本 z 检验

在这里,假设我们想知道 Girls 的平均得分是否比 Boy 高 10 分。我们得到的信息是,女孩的分数是 100,男孩的标准差是 90。然后,我们使用随机样本收集 20 名女孩和 20 名男孩的数据并记录他们的分数。最后,我们还将 ⍺ 值(显著性水平)设置为 0.05。

在此示例中:

  • 女孩的平均分数(样本平均值)为 641
  • 男孩的平均分数(样本平均值)为 613.3
  • Population of Girls' 的标准差为 100
  • Population of Boys' 的标准差为 90
  • 女孩和男孩的样本量均为 20
  • 总体均值之差为 10

因此,我们可以根据 p 值得出结论,我们无法否定原假设。我们没有足够的证据得出结论,女孩的平均得分比男孩高 10 分。很简单,对吧?

六、什么是 T 检验?

在以下情况下,T 检验是一种检验假设的统计方法:

  • 我们不知道总体方差
  • 我们的样本量很小,< 30

6.1 单样本 T 检验示例

当我们想要将样本均值与总体均值进行比较时,我们执行单样本 t 检验。与 z 检验的不同之处在于,我们在此处没有有关总体方差的信息。在这种情况下,我们使用样本标准差而不是总体标准差。

下面是一个理解单样本 t 检验的示例

假设我们想确定女孩在考试中的平均分数是否超过 600。我们没有与女孩分数的方差 (或标准差) 相关的信息。为了执行 t 检验,我们随机收集 10 个女孩的数据及其分数,并选择我们的 ⍺ 值(显着性水平)为 0.05 进行假设检验。

在此示例中:

  • 女孩的平均分数是 606.8
  • 样本大小为 10
  • 总体平均值为 600
  • 样本的标准差为 13.14

我们的 p 值大于 0.05,因此我们无法否定原假设,并且没有足够的证据来支持女孩在考试中平均得分超过 600 分的假设。

6.2 双样本 T 检验

当我们想要比较两个样本的均值时,我们执行双样本 t 检验。

下面是一个理解双样本 t 检验的示例

在这里,假设我们想要确定男生在考试中的平均得分是否比女生高 15 分。我们没有与女孩分数或男孩分数的方差(或标准差)相关的信息。执行 t 检验。我们随机收集了 10 名女孩和男孩的数据及其分数。我们选择 ⍺ 值(显著性水平)为 0.05 作为假设检验的标准。

在此示例中:

  • 男生的平均分数是 630.1
  • 女孩的平均分数是 606.8
  • 总体均值之间的差异 15
  • 男生分数的标准差为 13.42
  • 女生分数的标准差为 13.14

因此,p 值小于 0.05,因此我们可以否定原假设并得出结论,平均而言,男生在考试中的得分比女生高 15 分。

七、在 z 检验和 t 检验之间做出决定

        那么我们应该什么时候执行 z 检验,什么时候应该执行 t 检验呢?如果我们想掌握统计学,这是一个我们需要回答的关键问题。

如果样本数量足够大,则 z 检验和 t 检验将得出相同的结果。对于较大的样本量样本方差将是总体方差的更好估计值,因此即使总体方差未知,我们也可以使用样本方差的 z 检验。

同样,对于大样本 ,我们具有很高的自由度。由于 t 分布接近正态分布,因此z 分数和 t 分数之间的差异可以忽略不计。

八、Z 检验 vs T 检验

Z 测试T 检验
假设总体标准差是已知的总体标准差未知
样本量大样本量 (n > 30)样品量小 (n < 30)
分配Z 分布T 分布
检验统计量(样本均值 – 总体均值)/(总体 SD / √n)(样本均值 – 总体均值)/(样本 SD / √n)
假设检验检验总体均值或比率检验总体均值
自由度不適用n – 1
应用当总体标准差已知且样本量较大时使用当总体标准差未知或样本量较小时使用
测试男性成人的平均身高是否与已知值显著不同测试与旧方法相比,新的教学方法是否能提高学生的考试成绩

我们使用了 “scipy” 包的 “stats” 模块来计算测试统计量的临界值,以及 p 值。从这些值中,我们得出结论,我们没有证据来否定温度不会影响 COV-19 爆发的原假设。虽然我们找不到温度对 COV-19 的影响,但这个问题刚刚被用于对我们在本文中学到的内容进行概念理解。COVID-19 数据集的 z 检验存在某些限制:

  • 样本数据可能无法很好地代表总体数据
  • 样本方差可能不是总体方差的良好估计量
  • 一个州应对这种大流行的能力的可变性
  • 社会经济原因
  • 某些地方的早期突破
  • 一些州可能出于地缘政治原因隐藏了数据

因此,我们需要更加谨慎并进行更多研究,以确定这种大流行的模式。

九、结论

        在本文中,我们遵循分步过程来了解假设检验、1 类错误、2 类错误、显著性水平、临界值、p 值、非定向假设、方向假设、z 检验和 t 检验的基础知识。最后,我们为冠状病毒案例研究实施了双样本 z 检验。因此,您将在本文中清楚地了解 t 检验与 z 检验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/461277.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt限制QGraphicsScene QGraphicsItem内部的移动范围

用过QGraphicsView的都知道&#xff0c;原点一般设定在view和item的中心&#xff0c;所以帮助文档和这个网友说的不一定跟我们对的上&#xff1a; 关于Qt限制QGraphicsScene内部Item的移动范围_qgraphicsitem限制移动范围-CSDN博客 首先&#xff0c;设定view的scenerect&…

【Redis】浅析Redis大Key

目录 1、什么是Redis大Key 2、大 Key 是怎么产生的 3、大 Key 导致的问题 4、如何快速找到 Redis 大 Key 5、大 Key 优化策略 6、总结 我们在使用 Redis 的过程中&#xff0c;如果未能及时发现并处理 Big keys&#xff08;下文称为“大Key”&#xff09;&#xff0c;可能…

Jedis操作和springboot整合redis

Jedis-springboot整合redis Jedis 引入jedis依赖 注意事项 测试相关数据类型 Key String List set hash zset 案例 spring boot整合redis 引入相关依赖 在application.properties中配置redis 配置 创建redis配置类 创建测试类 Jedis 引入jedis依赖 <depen…

GenAI 生态系统现状:不止大语言模型和向量数据库

自 20 个月前 ChatGPT 革命性的推出以来&#xff0c;生成式人工智能&#xff08;GenAI&#xff09;领域经历了显著的发展和创新。最初&#xff0c;大语言模型&#xff08;LLMs&#xff09;和向量数据库吸引了最多的关注。然而&#xff0c;GenAI 生态系统远不止这两个部分&#…

HTML、JavaScript和CSS实现注册页面设计

目录 一、实现要求 二、实现页面图 1、注册页面 2.用户ID、用户名、口令验证成功后显示页面 三、用户ID、用户名、口令、确定口令验证逻辑js代码 1、验证用户ID 2、验证用户名 3、验证口令密码 四、总结 五、代码仓库 一、实现要求 综合使用HTML、JavaScript和CSS进…

Vue前端开发:事件绑定方式

事件定义 在Vue中&#xff0c;当一个元素通过使用v-on或语法糖指令绑定某个事件后&#xff0c;则完成了事件被定义的过程&#xff0c;在这定义的过程中&#xff0c;指令的后面是定义事件的名称&#xff0c;等号的后面是事件被触发后执行的函数&#xff0c;当然&#xff0c;也可…

mac-ubuntu虚拟机(扩容-共享-vmtools)

一、磁盘扩容 使用GParted工具对Linux磁盘空间进行扩展 https://blog.csdn.net/Time_Waxk/article/details/105675468 经过上面的方式后还不够&#xff0c;需要再进行下面的操作 lvextend 用于扩展逻辑卷的大小&#xff0c;-l 选项允许指定大小。resize2fs 用于调整文件系统的…

【AAOS】【源码分析】CarSystemUI

目录 目录 概述 CarSystemUI组件 源代码 源码位置 主要模块 编译选项 CarSystemUI与SystemUI 编译方式 Car Emulator默认服务 CarSystemUI 启动流程 缩略词 概述 AAOS中的SystemUI虽然相较手机要简单不少,但却是车载开发中的一个重要组件,它负责管理和控制车机…

C++知识点复习

对于这些问题的回答&#xff0c;可以按照思维导图的结构来组织答案&#xff0c;然后再进行回答。 C11用过哪些特性&#xff1f; &#xff08;首先&#xff0c;要回答好这个问题&#xff0c;需要注意问题的层次&#xff0c;不要一上来就说新增了某某关键字和语法&#xff0c;在…

.net framework 3.5sp1开启错误进度条不动如何解决

浏览器地址栏输入www.dnz9.com远程解决netframework问题 在Windows操作系统上安装或启用.NET Framework 3.5 SP1时&#xff0c;如果遇到进度条不动的问题&#xff0c;可能由多种原因引起。以下是一些可能的解决方案&#xff1a; 1. 使用Windows功能对话框 1.打开“控制面板”。…

openpnp - 在openpnp中单独测试相机

文章目录 openpnp - 在openpnp中单独测试相机概述笔记END openpnp - 在openpnp中单独测试相机 概述 底部相机的位置不合适, 重新做了零件&#xff0c;准备先确定一下相机和吸嘴的距离是多少才合适。 如果在设备上直接实验&#xff0c;那么拆装调整相机挺麻烦的。 准备直接在电…

Spring 框架中常见的注解(Spring、SpringMVC、SpringBoot)

1. Spring 中常见注解 还有Recourse&#xff1a;相当于AutowiredQualifier Value : 用于将配置文件中的值注入到Bean的字段中。 Bean : 用于在配置类中声明一个Bean。 Lazy : 用于延迟加载Bean。 2. SpringMVC 中常见注解 还有GetMapping PostMapping PutMapping DeleteMapp…

掌握分布式系统的38个核心概念

天天说分布式分布式&#xff0c;那么我们是否知道什么是分布式&#xff0c;分布式会遇到什么问题&#xff0c;有哪些理论支撑&#xff0c;有哪些经典的应对方案&#xff0c;业界是如何设计并保证分布式系统的高可用呢&#xff1f; 1. 架构设计 这一节将从一些经典的开源系统架…

OpenAI 的 Whisper:盛名之下,其实难副?

OpenAI 的 Whisper&#xff1a;盛名之下&#xff0c;其实难副&#xff1f; Whisper 的崛起与承诺 严重缺陷的曝光 风险分析 应对措施 结论 在人工智能的浪潮中&#xff0c;OpenAI 一直以其创新性和强大的技术实力备受瞩目。然而&#xff0c;最近 OpenAI 的语音转写工具 Wh…

【MySQL】可重复读级别下基于Next Key Lock解决幻读

昨天读到了一篇文章[1]&#xff0c;里面讲&#xff0c;面试官说mysql的可重复读级别下有解决幻读的方式&#xff0c;最后公布了答案&#xff0c;是在sql后面加for update。这么说倒是没错&#xff0c;但是这种问法给我一种奇怪的感觉&#xff0c;因为for update无论在哪个隔离级…

Kaggle “Reducing Commercial Aviation Fatalities” 比赛 生理数据分析

1、背景 Kaggle在2018 年 12 月 20 日举办“Reducing Commercial Aviation Fatalities” 比赛&#xff0c;通过收集飞行员的生理数据&#xff0c;判断飞行员何时会遇到麻烦吗&#xff1f;该比赛主要分析飞行员的问题&#xff0c;因为航班多、时间不固定&#xff0c;飞行员会出…

Python 字符串类型中 ``split(“\n“)`` 与 ``splitlines()`` 方法的一些区别

最近在以 self.__print("#" * 20 "\n") 调用自己写的 __print 接口时发现打印的时候 "\n" 没有打出来&#xff0c;进而发现了 split("\n") 与 splitlines() 方法的一些区别。 一个是参数上&#xff0c;split 需要传递一个字符串作为…

开源库 FloatingActionButton

开源库FloatingActionButton Github:https://github.com/Clans/FloatingActionButton 这个库是在前面这个库android-floating-action-button的基础上修改的&#xff0c;增加了一些更强大和实用的特性。 特性&#xff1a; Android 5.0 以上点击会有水波纹效果 可以选择自定义…

““ 引用类型应用举例

#include <iostream> //使能cin(),cout(); #include <stdlib.h> //使能exit(); #include <iomanip> //使能setbase(),setfill(),setw(),setprecision(),setiosflags()和resetiosflags(); //setbase( char x )是设置输出数字的基数,如输出进制数则用se…