信息与通信工程面试准备——数学知识|正态分布|中心极限定理

 

目录

 正态分布

正态分布的参数

正态分布的第一个参数是均值

正态分布的第二个参数是标准差SD

所有正态分布的共同特征

标准正态分布:正态分布的特例

中心极限定理

理解定义

示例# 1

示例# 2

知道样本均值总是正态分布的实际含义是什么?


 正态分布

        正态分布也被称为高斯分布或钟形曲线(因为它看起来像一个钟),这是统计学中最重要的概率分布,就像我们在大自然中经常看到的那样,它有点神奇。例如,身高、体重、血压、测量误差、智商得分等都服从正态分布。

        还有一个跟它相关的,并且非常重要的概念,叫中心极限定理,我们后面会提到。

        由上图可得一个正常变量的值是如何分布的。这是一个对称分布,其中大多数观测值聚集在具有最高发生概率的中心峰(均值/平均值)附近,并且当我们在两个方向上都偏离中心峰时,我们看到曲线尾部出现值的可能性越来越小。此图描绘了一个群体的智商水平,可以理解,智商水平非常低或智商水平很高的人很少见,并且大多数人都处于平均智商得分范围内。 

正态分布的参数

        正态分布总是以平均值为中心,而曲线的宽度则由标准差(SD)决定。

        这是两个正态分布,x轴上的高度单位是英寸,y轴上是特定高度对应的人数。

        1. 婴儿的平均身高为20英寸(50cm),标准差为0.6英寸(1.5cm)

        2. 成年人的平均分布为70英寸(175cm),标准差为4英寸(10cm)

        了解正态分布标准差的意义在于,它遵循一个经验法则,即大约95%的测量值落在均值附近的+/- 2倍个标准差之间。

        推论:95%的人口落在平均值+/- 2*SD之间

        1. 95%的婴儿身高在20 +/- 1.2英寸之间

        2. 95%的成年人身高测量值在70 +/- 8英寸之间

正态分布的第一个参数是均值

        均值或平均值是正态分布的集中趋势,它决定了曲线峰值的位置。平均值的变化导致曲线沿x轴水平移动。

正态分布的第二个参数是标准差SD

        标准差是正态分布变异性的量度,它决定了曲线的宽度。SD值的变化导致曲线变得更窄或更宽,并对曲线的高度产生反比例的影响。

        更紧的曲线(较小的宽度)->更高的高度

        更宽的曲线(更高的宽度)->更短的高度

        现在,你已经了解了正态分布曲线的所有基础知识。让我们继续学习与之相关的其他重要信息。

所有正态分布的共同特征

        1. 它们都是对称的

        2. 平均值=中位数

        3. 根据经验法则,我们可以确定正态分布曲线离均值标准差范围内的数据百分比。

        通过一个示例,这一点将变得更加清楚。

        让我们来看一个披萨外卖的例子。假设一家披萨餐厅的平均配送时间为30分钟,标准偏差为5分钟。根据经验法则,我们可以确定68%的交付时间在25-35分钟(30 +/- 5)之间,95%在20-40分钟(30 +/- 2*5)之间,99.7%在15-45分钟(30 +/-3*5)之间。

标准正态分布:正态分布的特例

        如前所述,正态分布根据参数值(平均值和标准差)有许多不同的形状。标准正态分布是正态分布的一个特例,均值为0,标准差为1。这个分布也称为Z分布。标准正态分布上的值称为标准分数Z分数。标准分数表示某一特定观测值高于或低于平均值的SD数。

        例如,标准得分为1.5表示观察到的结果比平均值高1.5个标准差。另一方面,负分数表示低于平均值的值。平均值的Z分数为0。


中心极限定理

         中心极限定理(CLT)指出,如果样本量足够大,则变量均值的采样分布将近似于正态分布,而与该变量在总体中的分布无关。

理解定义

示例# 1

        选取一个均匀分布[0,1],它被称为均匀分布,因为在0和1之间选择值的概率相等,因此它的概率密度函数(PDF)是水平的直线。现在,让我们假设我们从这个分布中随机抽取20个样本(绿点)并计算这些样本的均值,我们得到一个值,在这个例子中是0.5,用虚线表示。让我们把这个平均值画在直方图上。由于这个柱状图到目前为止只有一个平均值,它并没有告诉我们任何其他信息(左图)。继续从相同的分布中提取更多的随机样本,计算各自的平均值并将这些平均值绘制在直方图上,我们开始得到一个有趣的结果。

        随着我们从均匀分布中抽取越来越多的随机样本,并在直方图上绘制样本均值,我们得到一个正态分布结果如下(见右曲线)。

推论:我们从均匀的数据分布开始,但是从中抽取的样本均值是正态分布。

示例# 2

        在第二个例子中,让我们按照与第一个例子相同的步骤,唯一的不同是我们这次要从指数分布中提取样本。

        我们将再次随机抽取20个样本,计算样本的均值,并将其绘制在直方图上。计算100这样的样本的均值并将其画在直方图上,这样的分布对我们来说并不陌生。样本均值是正态分布!

推论:我们从指数数据分布开始,但从中抽取样本的均值得到正态分布。

        我们从指数数据分布开始,但是从中抽取的样本均值得到正态分布。因此,它在这一点上变得非常直观,中心极限定理意味着什么?

        中心极限定理意味着即使数据分布不是正态的,从中抽取的样本均值的分布也是正态的。

知道样本均值总是正态分布的实际含义是什么?

        在分析领域,我们每天都会遇到各种各样的数据,而源数据的分布并不总是被我们所知道的,但是,因为我们了解中心极限定理,所以我们甚至不需要关心源数据的分布,因为我们总是可以得到正态分布。

        为了使中心极限定理能够起作用,我们必须能够计算出样本的平均值。有一个分布称为柯西分布,没有样本均值,从而中心极限定理论并不适用于它,但除了柯西分布,我没有遇到除中心极限定理以外的任何其他分布。)

下面是了解均值正态分布的实际含义:

1. 我们可以用均值的正态分布来分配置信区间。

2. 我们可以进行T检验(即两个样本均值之间是否存在差异)

3. 我们可以进行方差分析(即3个或更多样本的均值之间是否存在差异)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/95085.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

设计HTML5列表和超链接

在网页中,大部分信息都是列表结构,如菜单栏、图文列表、分类导航、新闻列表、栏目列表等。HTML5定义了一套列表标签,通过列表结构实现对网页信息的合理排版。另外,网页中还包含大量超链接,通过它实现网页、位置的跳转&…

使用Python批量将Word文件转为PDF文件

说明:在使用Minio服务器时,无法对word文件预览,如果有需要的话,可以将word文件转为pdf文件,再存储到Minio中,本文介绍如何批量将word文件,转为pdf格式的文件; 安装库 首先&#xff…

DaVinci Resolve Studio 18 for Mac 达芬奇调色

DaVinci Resolve Studio 18是一款专业的视频编辑和调色软件,适用于电影、电视节目、广告等各种视觉媒体的制作。它具有完整的后期制作功能,包括剪辑、调色、特效、音频处理等。 以下是DaVinci Resolve Studio 18的主要特点: - 提供了全面的视…

一次Linux中的木马病毒解决经历(6379端口---newinit.sh)

病毒入侵解决方案 情景 最近几天一直CPU100%,也没有注意看到了以为正常的服务调用,直到腾讯给发了邮件警告说我的服务器正在入侵其他服务器的6379端口,我就是正常的使用不可能去入侵别人的系统的,这是违法的. 排查 既然入侵6379端口,就怀疑是通过我的Redis服务进入的我的系统…

Maven官网下载配置新仓库

1.Maven的下载 Maven的官网地址:Maven – Download Apache Maven 点击Download,查找 Files下的版本并下载如下图: 2.Maven的配置 自己在D盘或者E盘创建一个文件夹,作为本地仓库,存放项目依赖。 将下载好的zip文件进行解…

初识Redis

目录 认识Redis分布式系统Redis的特性Redis的应用场景Redis客户端Redis命令 认识Redis 上面一段话是官网给出的对Redis的介绍,in-memory data store表明Redis是在内存中存储数据的,这和我们接触的其他数据库就有很大的不同,比如MySQL&#xf…

02-前端基础第二天-HTML5

01-HTML标签(下)导读 目标: 能够书写表格能够写出无序列表能够写出3~4个常用input表单类型能够写出下拉列表表单能够使用表单元素实现注册页面能够独立查阅W3C文档 目录: 表格标签列表标签表单标签综合案例查阅文档 02-表格标…

OptaPlanner笔记1

1.1 什么是OptaPlanner 每个组织都面临规划问题:为产品或服务提供有限的受约束的资源(员工、资产、时间和金钱)。OptaPlanner用来优化这种规划,以实现用更少的资源来做更多的业务。 这被称为Constraint Satisfaction Programming…

【Java】Spring——Bean对象的作用域和生命周期

文章目录 前言一、引出Bean对象的作用域1.普通变量的作用域2.Bean对象的作用域 二、Bean对象的作用域1.Bean对象的6种作用域2.设置Bean对象的作用域 三、Bean对象的生命周期总结 前言 本人是一个普通程序猿!分享一点自己的见解,如果有错误的地方欢迎各位大佬莅临指导,如果你也…

Java实现微信小程序V3支付 (完整demo)

1. 微信小程序支付-开发者文档https://pay.weixin.qq.com/wiki/doc/apiv3/apis/chapter3_5_1.shtml 2. 导入依赖 <!--小程序支付 v3--> <dependency><groupId>com.github.wechatpay-apiv3</groupId><artifactId>wechatpay-apache-httpclient<…

Pytest和Unittest测试框架的区别?

如何区分这两者&#xff0c;很简单unittest作为官方的测试框架&#xff0c;在测试方面更加基础&#xff0c;并且可以再次基础上进行二次开发&#xff0c;同时在用法上格式会更加复杂&#xff1b;而pytest框架作为第三方框架&#xff0c;方便的地方就在于使用更加灵活&#xff0…

Vue2中根据权限添加动态路由

Vue2中根据权限添加动态路由 大概记录一下主要代码 1.根据后端返回的路由列表生成左侧菜单&#xff08;后端返回的数据结构中用id和pid来区别包含关系&#xff09; 大概结构如下&#xff1a; 2.前端需要处理成包含children的树形结构 //动态生成菜单 export const gener…

【Leetcode】102.二叉树的层序遍历

一、题目 1、题目描述 给你二叉树的根节点 root ,返回其节点值的 层序遍历 。 (即逐层地,从左到右访问所有节点)。 示例1: 输入:root = [3,9,20,null,null,15,7] 输出:[[3],[9,20],[15,7]]示例2: 输入:root = [1] 输出:[[1]]示例3: 输入:root = [] 输出:[]…

电力应用 | Intewell操作系统新疆特变项目应用案例

近日&#xff0c;科东软件Intewell操作系统在新疆特变项目成功应用&#xff0c;该方案保障了变电站的电力设备在高电压下稳定运行&#xff0c;实现变电站的智能化控制&#xff0c;极大程度上节省了人力、物力和财力资源&#xff1b;可实时监控电力设备的异常情况&#xff0c;及…

【系统架构】系统架构设计之数据同步策略

文章目录 一、介绍1.1、分布式系统中的数据同步定义1.2、为何数据同步如此关键1.3、数据同步策略简介 二、为什么需要数据同步2.1、提高系统可用性2.2、备份与灾难恢复2.3、提高性能2.4、考虑地理位置&#xff08;如使用CDN&#xff09; 三、同步备份3.1、定义和概述3.2、工作原…

Vue3 setup新特性简单应用

去官网学习→组合式 API&#xff1a;setup() | Vue.js 运行示例&#xff1a; 代码&#xff1a;App.vue <template><div class"home"><img alt"Vue logo" src"../assets/logo.png"><!-- msg 组件传递数据 --><Hell…

小象课堂在线授课教育系统

此项目包含后端全部代码&#xff0c;前端包括后台和web界面的源码&#xff0c;数据库用的mysql,可当作课设或者毕设&#xff0c;还可写入自己的简历中 web界面展示&#xff1a; 前端后台界面展示&#xff1a; 用户管理 课程管理 内容配置 订单管理 系统管理 系统监控

部署mysql到win10电脑上

中间出现了很多问题&#xff0c; 记录一下 我这边是去官网下载的 &#xff0c;链接&#xff1a;https://dev.mysql.com/downloads/mysql/ 我这边选了不是最新版本的MySQL&#xff0c;因为第一次安装8.1.0版本的&#xff0c;死活运行不起来&#xff0c;直接卸载安重装了&#x…

【QT+ffmpeg】QT+ffmpeg 环境搭建

1.qt下载地址 download.qt.io/archive/ 2. win10sdk 下载 https://developer.microsoft.com/en-us/windows/downloads/windows-sdk/ 安装 debug工具路径 qtcreater会自动识别 调试器选择

FirmAE 工具安装(解决克隆失败 网络问题解决)

FirmAE官方推荐使用Ubuntu 18.04系统进行安装部署&#xff0c;FirmAE工具的安装部署十分简单&#xff0c;只需要拉取工具仓库后执行安装脚本即可。 首先运行git clone --recursive https://kgithub.com/pr0v3rbs/FirmAE命令 拉取FirmAE工具仓库&#xff0c;因为网络的问题&…