概率论和数理统计(三)数理统计基本概念

前言

“概率论”是给定一个随机变量X的分布F(x),然后求某事件A概率 P ( x ∈ A ) P(x \in A) P(xA)或者随机变量X的数字特征.“统计”是已知一组样本数据 { x 1 , x 2 , . . . x n } \{x_1,x_2,...x_n\} {x1,x2,...xn},去求分布F(x)

统计的基本概念

在统计中,总体X的分布要么未知,要么分布形式已知但参数未知,需要抽取部分个体来推断。

总体与样本

在这里插入图片描述

代表性的进一步解释: X i X_i Xi与总体 X X X 同分布。保证总体中每个值都有同样的机会被抽到

关于样本是谁随机变量,还是值?

  • 当代入总体分布函数时是值
  • 当样本分布函数(抽样分布)分析的时候是随机变量

简单随机样本的性质

在这里插入图片描述
在这里插入图片描述

统计量

统计量来自总体一个样本,不含任何未知参数,完全由样本来确定,也就是说,根据样本可以求出我们需要的任何一个统计量的值。
在这里插入图片描述

常用统计量

在这里插入图片描述

为什么样本方差的分母是 n-1?
只要采样数小于个体数,采样本身就会引入分布的误差,因此需要进行较正。
采样带来的误差就是原来分布的强化,是可以计算的n/(n-1)的修正并非随便给的
在这里插入图片描述
如图 E [ S 2 ] ∗ n / ( n − 1 ) E[S^2]*n/(n-1) E[S2]n/(n1)是正常的方差,所以修正过的样本方差 = 末修正过的样本方差*n/(n-1),

抽样分布

样本统计量的分布称为抽样分布.他通常也是随机变量X的分布函数.抽样分布中,最常用的分布其实是4种:z 分布(即正态分布)、卡方分布、t分布、F分布。

卡方分布

在这里插入图片描述

在这里插入图片描述

  • 关于标准正态N(0,1):EX=0,DX=1
  • 根据总体标准正态,求得样本卡方分布: EX=n,DX=2n
  • ∑ i = 1 n E ( X i 2 ) = ∑ i = 1 n E ( ( X i − X ˉ + X ˉ ) 2 ) \sum_{i=1}^nE(X_i^2) = \sum_{i=1}^nE((X_i-\bar{X}+\bar{X})^2) i=1nE(Xi2)=i=1nE((XiXˉ+Xˉ)2)
  • = ∑ i = 1 n E ( ( X i − X ˉ ) 2 + 2 X i X ˉ − X ˉ 2 ) ) = \sum_{i=1}^nE((X_i-\bar{X})^2+2X_i\bar{X}-\bar{X}^2)) =i=1nE((XiXˉ)2+2XiXˉXˉ2))
  • = ∑ i = 1 n [ D ( X i ) + E 2 ( X i ) ] = \sum_{i=1}^n[D(X_i)+E^2(X_i)] =i=1n[D(Xi)+E2(Xi)]

参数估计

主要解决总体分布形式已知但参数未知,即总体 X X X分布函数 F ( x , θ ) F(x, \theta) F(x,θ) 形式已知,估计未知参数 θ \theta θ

点估计

在这里插入图片描述

矩估计法

在这里插入图片描述
在这里插入图片描述

极大似然估计

在这里插入图片描述

极大似然估计以“我抽样出来的情况就是最大概率”的情况为前提,求参数 θ \theta θ的最大值.

在这里插入图片描述

估计量的优良性评判

既然是估计量,那与真实值之间就存在误差,因此需要判断估计量是否满足我们的要求,可以通过下面的几个准则来进行评判。
在这里插入图片描述
在这里插入图片描述

区间估计

在这里插入图片描述

矩估计法的前提是基于“抽样分布”和“主分布”是一致的情况下. 区间估计法则是表示定置水平一致的情况下,你去构建枢轴变量(带未知数统计量)和抽样分布,最终确定未知量

定置水平的理解: 你要估计全班的身高, 抽样了10得出了身高区间(a,b),然后给出了全部97%的人,身高在(a,b).97%就属于定置水平

在这里插入图片描述

x ˉ − u σ / n {{\bar{x}-u} \over {\sigma}/\sqrt{n}} σ/n xˉu是正态分布 N ( u , σ 2 ) N(u,\sigma^2) N(u,σ2)转为标准正态 N ( 0 , 1 ) N(0,1) N(0,1)的随机变量X的转换关系

统计量参考

在这里插入图片描述

假设检验

假设检验的基本原理:给定一个假设 H 0 H_0 H0,为了检验 H 0 H_0 H0是否正确,首先假定 H 0 H_0 H0是正确的,然后根据抽取到的样本来判断是接收还是拒绝该假设。如果样本中出现了不合理的观测值,应该拒绝 H 0 H_0 H0,否则应该接受假设

  1. 观测值:即样本的统计量
  2. “不合理”指的是小概率事件发生,常用 α \alpha α来表示这个小概率,也被称为检验的显著性水平 (与点估计中区间估计中的信置水平,差不多的功能).

定义

拒绝域与临界值

在这里插入图片描述

从某种意义上说,设计一个检验,本质上就是找到一个恰当的拒绝域W,使得当 H 0 H_0 H0成立时
P ( x ∈ W ∣ H 0 成立 ) = α P(x \in W|H_0成立)=\alpha P(xWH0成立)=α
即把“小概率事件”视为与拒绝域 W W W是等价的

假设检验存在两类错误

在这里插入图片描述

  • 通常只规定 α \alpha α的取值,即控制犯第I类错误的概率
  • 使犯第二类错误的概率尽可能小,要使两者犯错的概率都小,就必须增大样本容量

参数假设检验

在这里插入图片描述

在这里插入图片描述

统计量参考

在这里插入图片描述

关于为什么总分布都是以正态分布?

因为中心极限定理。自然界的很多现象都是由无数微小因素的叠加而产生的,而无论这种因素服从何种分布,在大尺度上来观察,其结果都应大致符合正态分布。
网上有一篇文章叫《正态分布的前世今生》,非常推荐学习概率统计的人读一读。

卡方拟合优度检验

前面的假设检验,都是通过抽样来对总体参数进行的假设检验,且集中在正态总体下的参数假设检验。但在实际问题中,可能存在我们对要研究的总体,并不知晓是什么分布。卡方拟合优度检验就是对未知总体的分布提出一个假设,例如:假设该总体服从正态分布、泊松分布、指数分布、二项分布等,根据样本获得的信息,检验假设是否成立。

拟合优度是指:抽样获得的观测频次与原假设分布中理论频次(也叫期望频次)的差异,若观测频次和理论频次越接近,意味着符合程度越好,即拟合优度更好。

在这里插入图片描述
分布拟合优度检验所采用的检验统计量渐近 χ 2 \chi^2 χ2分布

  • 使用了大样本的性质,所以要求样本容量n足够大
  • 各区间的理论频数 n p i np_i npi不能太小
简单的例子

在这里插入图片描述
在这里插入图片描述

主要参考

《为什么样本方差(sample variance)的分母是 n-1》
《数理统计学习笔记01:数理统计的基本概念》
《数理统计学习笔记03:参数的点估计》
《第六章 数理统计的基本概念》
《第七章 参数估计》
《期末复习——概率论与数理统计基本概念总结》
《第八章 假设检验》
《数理统计8.5-卡方拟合优度检验》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/195090.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【无标题】chapter6卷积

此例以说明全连接层处理图片的时候会遇到参数过多 模型过大的问题 参数比要研究的物体总数还多 卷积,特殊的全联接层 平移不变形,局部性 原本权重为二维(输入和输出全联接,想想下表组合,就是个二维的矩阵)…

ResNet 原论文及原作者讲解

ResNet 论文摘要1. 引入2. 相关工作残差表示快捷连接 3. 深度残差学习3.1. 残差学习3.2. 快捷恒等映射3.3. 网络体系结构普通网络 plain network残差网络 residual network 3.4. 实施 4. 实验4.1. ImageNet分类普通的网络 plain network残差网络 residual network恒等vs.快捷连…

修改 jar 包中的源码方式

在我们开发的过程中,我们有时候想要修改jar中的代码,方便我们调试或或者作为生产代码打包上线,但是在IDEA中,jar包中的文件都是read-only(只读模式)。那如何我们才能去修改jar包中的源码呢? 1.…

Python winreg将cmd/PowerShell(管理员)添加到右键菜单

效果 1. 脚本 用管理员权限运行,重复执行会起到覆盖效果(根据sub_key)。 icon自己设置。text可以自定义。sub_key可以改但不推荐(避免改成和系统已有项冲突的)。command不要改。 from winreg import *registry r&q…

第28章_mysql缓存策略

文章目录 MySQL缓存方案目的分析缓存层作用举例 缓存方案选择场景分析 提升MySQL访问性能的方式MySQL主从复制读写分离连接池异步连接 缓存方案缓存和MySQL一致性状态分析制定读写策略 同步方案canalgo-mysql-transfer 缓存方案的故障问题及解决缓存穿透缓存击穿缓存雪崩缓存方…

「分享学习」SpringCloudAlibaba高并发仿斗鱼直播平台实战完结

[分享学习]SpringCloudAlibaba高并发仿斗鱼直播平台实战完结 第一段:简介 Spring Cloud Alibaba是基于Spring Cloud和阿里巴巴开源技术的微效劳框架,普遍应用于大范围高并发的互联网应用系统。本文将引见如何运用Spring Cloud Alibaba构建一个高并发的仿…

基于JavaWeb+SSM+社区居家养老服务平台—颐养者端微信小程序系统的设计和实现

基于JavaWebSSM社区居家养老服务平台—颐养者端微信小程序系统的设计和实现 源码获取入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 前言 在复杂社会化网络中,灵活运用社会生活产生的大数据&am…

理解 R-CNN:目标检测的一场革命

一、介绍 对象检测是一项基本的计算机视觉任务,涉及定位和识别图像或视频中的对象。多年来,人们开发了多种方法来应对这一挑战,但基于区域的卷积神经网络(R-CNN)的发展标志着目标检测领域的重大突破。R-CNN 及其后续变…

php-cli

//运行index.php ./php index.php//启动php内置服务器 ./php -S 0.0.0.0:8080//启动内置服务在后台运行,日志输出到本目录下的server.log nohup ./php -S 0.0.0.0:8080 -t . > server.log 2>&1 &# 查找 PHP 进程 ps aux | grep "php -S 0.0.0.0:…

用Postman发送xml数据

启动Postman: 点击左上角的“New”,在弹出窗中选择HTTP: 选择POST方法: 点击Body: 选择raw: 在右侧的下拉列表中选择XML: 在下面的输入框中输入或者从其它地方拷贝XML文本:…

玩具、儿童用品、儿童服装上亚马逊TEMU平台CPC认证办理

CPC认证是Childrens Product Certificate的简称,即儿童产品证书。它是美国强制性法规CPSIA要求的一部分,该法规主要针对12岁及以下儿童使用的产品,如玩具、儿童用品、儿童服装等。 一、儿童小汽车CPC测试项目可能会因产品标准和法规的不同而…

12-2- DCGAN -简单网络-卷积网络

功能 随机噪声→生成器→MINIST图像。 训练方法 0 损失函数:gan的优化目标是一个对抗损失,是二分类问题,用BCELoss 1 判别器的训练,首先固定生成器参数不变,其次判别器应当将真实图像判别为1,生成图像判别为0 loss=loss(real_out, 1)+loss(fake_out, 0) 2 生成器的…

CocosCreator3.8神秘面纱 CocosCreator 项目结构说明及编辑器的简单使用

我们通过Dashboard 创建一个2d项目,来演示CocosCreator 的项目结构。 等待创建完成后,会得到以下项目工程: 一、assets文件夹 assets文件夹:为资源目录,用来存储所有的本地资源,如各种图片,脚本…

BIO、NIO、AIO三者的区别及其应用场景(结合生活例子,简单易懂)

再解释三者之前我们需要先了解几个概念: 阻塞、非阻塞:是相较于线程来说的,如果是阻塞则线程无法往下执行,不阻塞,则线程可以继续往下 执行。同步、异步:是相较于IO来说的,同步需要等待IO操作完…

ncbi-datasets-cli-高效便捷下载NCBI数据

文章目录 简介安装datasets download下载基因组/基因序列按照GCA list文件编号下载下载大基因组genome完整参数gene参数 datasets summary下载元数据dataformat将json转换成表格格式通过json文件解析其他字段问题 简介 NCBI Datasets 可以轻松从 NCBI 数据库中收集数据。使用命…

navigator.geolocation.getCurrentPosition在谷歌浏览器不执行的问题

/*** 获取我的位置*/getNavigatorLocation: function () {navigator.geolocation.getCurrentPosition(function (success) {console.log(inner>>>, success);if (success && success.coords) {var data success.coords;var point "POINT(" data.…

鉴源论坛 · 观模丨软件单元测试真的有必要吗?(下)

作者 | 包丹珠 上海控安产品总监 版块 | 鉴源论坛 观模 社群 | 添加微信号“TICPShanghai”加入“上海控安51fusa安全社区” “软件单元测试真的有必要吗?(上)”一文中,着重探讨了单元测试的重要性及其正面临的困境&#xff0c…

vue下载xlsx表格

vue下载xlsx表格 // 导入依赖库 import XLSX from xlsx; import FileSaver from file-saver; methods:{btn(){let date new Date()let Y date.getFullYear() -let M (date.getMonth() 1 < 10 ? 0 (date.getMonth() 1) : date.getMonth() 1) -let D (date.getDat…

220V交流转直流的简易电源设计

220V交流转直流的简易电源设计 设计简介设计原理电路图变压器电路交流转直流电路3.3V电源接口电路 PCB3D图 实践检验 设计简介 通过模拟电路的相关知识&#xff0c;尝试将220V的交流电转化为我们指定电压的直流电。 设计原理 将220V交流电转化为直流电的方法常用的有通过变压器…