模型 正态分布(通俗解读)

系列文章 分享 模型,了解更多👉 模型_思维模型目录。随机世界的规律,大自然里的钟形曲线。


1 正态分布的应用

1.1 质量管理之六西格玛

六西格玛是一种旨在通过识别和消除缺陷原因来提高制造过程或业务流程质量的管理策略。我们先来了解下六西格玛相关的基本概念:

  • 西格玛等级:西格玛等级是一个衡量过程能力的指标,表示缺陷率的多少。一个过程的西格玛等级越高,其缺陷率越低。
  • 缺陷:在六西格玛中,缺陷是指任何不符合规格的产品或服务。
  • 过程能力:指一个过程在没有特殊原因影响下,能够持续生产符合规格要求的产品或服务的能力。

接下来说明下正态分布与六西格玛的关系:

  • 在六西格玛中,假设大多数过程的输出是正态分布的。这意味着过程的输出变量(如产品尺寸、重量等)会围绕均值对称分布,并且大部分输出值会集中在均值附近。
  • 利用正态分布的特性,六西格玛方法可以预测和控制过程的缺陷率。例如,如果一个过程的输出是正态分布的,那么大约99.73%的产品将位于均值的±3个标准差范围内。

这里给出一个六西格玛方法的使用案例,便于深入理解该方法。假设一个制造过程生产的小部件的尺寸是关键的质量指标,该尺寸服从正态分布。通过测量和分析,我们知道部件的尺寸均值为100毫米,标准差为1毫米。

  • 过程能力分析:使用正态分布的特性,我们可以计算出在均值±3σ(简单理解为误差±3毫米)范围内的部件比例,这将帮助我们了解过程的稳定性和一致性。
  • 缺陷预防:如果我们设定规格限为98毫米到102毫米,那么任何超出这个范围的部件都被视为缺陷。通过正态分布,我们可以预测大约有多少部件会超出规格限,从而采取措施减少这些缺陷。
  • 持续改进:通过收集数据和分析过程输出的分布,六西格玛团队可以识别导致缺陷的潜在原因,并采取措施来减少变异,提高过程的西格玛等级。

六西格玛方法强调使用数据和统计工具来驱动决策,正态分布在这一过程中发挥了核心作用,帮助组织实现更高的质量标准和更低的缺陷率。

1.2 风险管理中的VaR估算(通俗解读)

你是一个小岛国的财务顾问,这个国家有一个由500个当地最大企业组成的股票市场指数,我们称之为“小岛500指数”。这个指数类似于现实世界中的S&P 500指数。作为财务顾问,你的任务是帮助岛上的居民了解他们的投资可能面临的风险。

首先,你需要向居民解释什么是VaR。你可以这样描述:“VaR就像是一个天气预报,告诉我们在大多数情况下,我们可能会遇到的最大风暴(损失)。但就像天气有时会出乎意料一样,VaR并不保证损失不会超过预报的数额。”

接下来,你开始收集过去几年“小岛500指数”的每日价格变动数据。这就像是记录每天的天气变化,以便我们可以预测未来的天气模式。我们使用正态分布估算VaR:

  1. 计算平均收益:你计算了这段时间内指数的平均每日收益,假设是0.05%。
  2. 计算标准差:接着,你计算了收益的标准差,这是衡量收益波动大小的指标,假设是1%。
  3. 确定置信水平:你告诉居民,你将使用95%的置信水平来计算VaR,这意味着在95%的交易日里,损失不会超过你计算出的数额。

于是开始使用正态分布的相关知识计算VaR,流程如下:

  1. 使用正态分布:你假设指数的收益遵循正态分布,这是一个常见的数学分布,形状像一个钟形曲线。
  2. 查找Z-分数:在95%的置信水平下,你查找到对应的Z-分数,这是正态分布表中的一个数值,用来确定损失超过多少标准差。
  3. 计算VaR:使用以下公式计算VaR: VaR=平均收益−(Z-分数×标准差)VaR=平均收益−(Z-分数×标准差) 假设Z-分数是1.65,代入数字得到: VaR=0.0005%−(1.65×0.01)=−1.645%VaR=0.0005%−(1.65×0.01)=−1.645% 这意味着在95%的交易日里,指数的每日损失不会超过1.645%。

你向岛上的居民解释说:“根据我们的计算,如果你们投资了‘小岛500指数’,那么在95%的交易日里,你们的最大损失可能不会超过1.645%。这就像我们告诉你们,95%的时间里,风暴的强度不会超过这个级别。”

居民们现在对可能面临的投资风险有了更好的理解,并且可以根据这个信息做出更明智的投资决策。当然,你也提醒他们,这只是一个估计,实际损失有时会超出这个范围,就像偶尔也会有意外的大风暴一样。

以上就是形象的解读VaR概念以及它在评估投资风险中的应用。

1.3 正态分布优化神经网络之激活函数

正态分布在人工智能(AI)领域的应用非常广泛,其中一个具体的应用案例是在神经网络中的激活函数。激活函数(形象解读激活函数:它就像神经网络中的交通信号灯,它告诉网络在何时“通行”(激活神经元)或“停止”(抑制激活)。不同类型的激活函数就像不同的信号灯模式,有的快速反应(ReLU),有的平滑过渡(Sigmoid),确保信息流在网络中高效有序地传递)是神经网络中的基本构件,用于在神经元之间引入非线性,使得网络能够学习和模拟复杂的函数映射。正态分布,特别是其变体,如高斯分布,可以作为激活函数的一种选择。

在神经网络的上下文中,正态分布可以用于模拟数据的分布,帮助网络更好地适应输入数据的统计特性。例如,如果输入数据的分布接近正态分布,使用正态分布作为激活函数可以提高网络对数据的拟合能力(就像是一位画家在画布上模仿自然风景。如果画家技艺高超,他画的画就能非常接近真实的风景,细节丰富,色彩逼真。在这里,画家的技艺相当于神经网络的学习能力,而画布上的作品则相当于网络对数据的拟合结果。提高拟合能力意味着神经网络能够更准确地捕捉和再现数据的特征,就像画家能更精确地复制自然景观一样)。此外,正态分布的数学特性,如其平滑性和可微性,使其在梯度下降等优化算法中表现良好,有助于网络的训练过程。

1.4 正态分布在生化检验中的应用

生化检验是利用生物或化学方法对各项人体指标进行检查化验,例如肝功能、血脂、血糖等。在这些检验中,很多指标如血糖、甘油三酯、血红蛋白、红细胞数、白细胞以及血小板等的频数呈现正态分布规律。

这种正态分布规律的发现对于生化检验具有重要的实际价值,因为它可以帮助医生更准确地评估检验结果,确定正常范围,并为临床诊断提供有力的数据支撑。

例如,当检验结果显示某项指标的数值高于或低于正常范围时,这可能表明人体出现了不同程度的异常。通过测定血清天冬氨酸氨基转移酶这一指标,如果生化检验结果偏高,则可能与心肌梗塞、中毒性肝炎等病症相关。

因此,正态分布在生化检验中的应用,不仅有助于医学参考值范围的制定,还能在质量控制、试验设计和结果分析等方面发挥重要作用。

1.5 正态分布在教育领域考试结果分析中的应用

某市的重点高中在一次期末考试后,对数学成绩进行了统计分析。这所高中以其高标准和严格的教学方法而闻名。学校收集了所有参加期末考试的高二学生的成绩数据,共计300名学生。对其进行数据分析,具体如下:

  1. 数据整理:学校将成绩数据录入统计软件,并计算了成绩的均值和标准差。
  2. 分布形态:通过绘制成绩的直方图,学校发现成绩分布呈现出明显的右偏态(正偏态),即大部分学生的成绩集中在高分区域,而低分区域的成绩较少。

通过正态分布的应用发现:

  1. 偏态分布特征:分析结果显示,成绩的均值为92分,标准差为8分,但成绩的分布并不是对称的,而是向右偏斜,表明高分学生较多。
  2. 成绩区间预测:尽管成绩分布不是正态分布,学校仍使用正态分布理论来估计不同成绩区间的学生比例,发现超过70%的学生成绩高于84分(均值加一个标准差)。
  3. 教学效果评估:由于成绩分布的偏态,学校意识到可能存在“天花板效应”,即考试难度不足以区分高水平学生之间的差异。
  4. 考试难度调整:学校发现考试内容可能过于简单,导致大部分学生都能轻易获得高分,这可能掩盖了学生之间真实的能力差异。

呈现的结果与影响:

  • 考试内容调整:学校决定在未来的考试中增加难度,以更好地区分学生的不同能力水平。
  • 教学方法改进:学校意识到需要调整教学方法,以确保所有学生都能在更高难度的考试中表现出色。
  • 学生能力识别:学校利用偏态分布的分析结果来识别那些在高难度问题上表现出色的学生,并为他们提供更高级的课程和挑战。

这次期末考试的成绩分析揭示了考试内容和教学方法可能需要改进的地方。虽然成绩的偏态分布不是理想的正态分布,但它为学校提供了宝贵的信息,帮助学校更好地理解学生的表现,并据此做出相应的教学和考试调整。

2 模型 正态分布

2.1 什么是正态分布?

正态分布,也称为高斯分布(Gaussian distribution),是一种在统计学中非常重要的连续概率分布。它具有以下特征:

  1. 对称性:正态分布是对称的,其均值(mean)、中位数(median)和众数(mode)相同。
  2. 钟形曲线:正态分布的图形呈现为一个钟形曲线,两侧逐渐向X轴下降。
  3. 均值和标准差:正态分布完全由其均值(μ)和标准差(σ)确定。均值是分布的中心位置,标准差描述了数据的分散程度。
  4. 68-95-99.7规则:在正态分布中,大约68%的数据位于均值±1个标准差的范围内,95%的数据位于均值±2个标准差的范围内,99.7%的数据位于均值±3个标准差的范围内。

正态分布的数学表达式为:

正态分布最早由德国数学家和天文学家莫里茨·卡尔·弗里德里希·本茨(Moritz Carl Friedrich Benz)在1810年或1811年提出,但并未得到广泛认可。后来,德国数学家和天文学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)在1812年左右独立发现了这一分布,并将其应用于天文学中最小二乘法的误差分析。由于高斯在科学界的巨大影响力,这一分布最终以他的名字命名为高斯分布。

正态分布在19世纪由比利时数学家昆特莱特(Adolphe Quetelet)进一步推广到社会和自然科学领域。昆特莱特发现,许多自然和社会科学现象的测量结果都呈现出正态分布的特性。

正态分布在统计学和概率论中的重要性,使得它成为许多统计方法的基础,如假设检验、回归分析、抽样分布等。

2.2 为什么会有正态分布?

正态分布在自然界和社会现象中的普遍性可以通过多种理论来解释。以下是一些可能的原因,这些原因导致了正态分布的普遍性:

  • 中心极限定理:这是正态分布普遍性的最主要原因之一。根据中心极限定理,如果多个相互独立的随机变量之和(无论这些变量本身遵循什么分布)的样本量足够大,它们的分布将趋近于正态分布。这意味着即使原始数据不遵循正态分布,它们的平均值或总和往往也会呈现出正态分布的特性。
  • 测量误差:在许多情况下,观测到的变量可能受到多种小的、随机的测量误差的影响。这些小误差的叠加往往会导致正态分布。
  • 自然选择和进化:在生物学中,自然选择可能导致某些特征(如身高、体重)在种群中呈现出正态分布,因为极端值可能不利于生存和繁殖。
  • 经济和社会因素:在经济和社会现象中,多种因素的相互作用可能导致结果的分布趋于正态。例如,收入水平可能受到教育、工作经验、地理位置等多种因素的影响,这些因素的综合作用可能导致收入分布接近正态。
  • 大数定律:大数定律指出,当样本量足够大时,样本均值的分布将趋近于总体均值的分布。如果总体分布本身是正态的,那么样本均值的分布也将是正态的。
  • 物理过程:在物理学中,许多自然过程(如分子的热运动)可以产生正态分布的结果。例如,气体分子的速度分布遵循麦克斯韦-波尔兹曼分布,这是一种正态分布的特例。
  • 心理学因素:在心理学中,人们的感知和判断往往受到多种因素的影响,这些因素的综合作用可能导致某些心理测量结果呈现出正态分布。
  • 统计假设:在统计学中,正态分布经常被用作分析的假设前提,因为许多统计方法(如线性回归、ANOVA等)在正态分布的假设下具有最佳性能。
  • 数据生成过程:在某些情况下,数据生成过程本身可能就会产生正态分布的结果。例如,某些化学反应的速率可能遵循正态分布。
  • 抽样分布:在抽样调查中,如果样本是从正态分布的总体中抽取的,那么样本均值的分布也将是正态的,即使样本量不大。

这些原因中的一些是统计学和概率论的理论结果,而另一些则是对自然界和社会现象的观察和解释。正态分布的普遍性是这些因素共同作用的结果。

3 模型简图


​​​​​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/390317.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CX32L003F8P6T芯片解密程序破解

CX32L003F8P6T可替代N76E003 CX32L003是一款内嵌32位ARM Cortex-M0内核的超低功耗、Low Pin Count和宽电压工作范围(2.5V~5.5V)的微控制器,最高可运行在24MHz,内置32K/64K字节的嵌入式Flash,4K字节的SRAM,集成了12位1Msps高精度SA…

C++ 初探(13课)

#include<iostream> using namespace std; int main() {cout<<"Helloworld"<<endl; } 函数:一段能够被反复调用的代码,可以接收输入,进行并行处理或者产生输出; ——返回类型:表示函数返回结果的类型,可以为void ——函数名称:用于函数的…

【JAVA设计模式】适配器模式——类适配器模式详解与案例分析

前言 在软件设计中&#xff0c;适配器模式&#xff08;Adapter Pattern&#xff09;是一种结构型设计模式&#xff0c;旨在使不兼容的接口能够协同工作。它通过引入一个适配器类&#xff0c;帮助两个接口之间进行适配&#xff0c;使得它们能够互相操作。本文将详细介绍适配器模…

大学生编程入门指南:如何从零开始?

人不走空 &#x1f308;个人主页&#xff1a;人不走空 &#x1f496;系列专栏&#xff1a;算法专题 ⏰诗词歌赋&#xff1a;斯是陋室&#xff0c;惟吾德馨 目录 编程语言选择 &#x1f4da; 1. Python 2. JavaScript 3. Java 4. C/C 如何选择适合自己的编程语言&a…

vim列编辑模式

在编辑文本时&#xff0c;经常会有这样的需求&#xff0c;对特定列进行进行批量编辑。比如批量注释一段代码&#xff0c;或者删除待定字符&#xff08;如一列空格&#xff09;。幸运的是VIM支持列编辑模式。 假设文本内容&#xff1a; Maximum length of a custom vocabulary…

svm总结

什么是SVM&#xff1f; SVM的英文全称是Support Vector Machines&#xff0c;我们叫它支持向量机。支持向量机是我们用于分类的一种算法。让我们以一个小故事的形式&#xff0c;开启我们的SVM之旅吧。 在很久以前的情人节&#xff0c;一位大侠要去救他的爱人&#xff0c;但天…

Selenium自动化测试入门:浏览器多窗口切换【建议收藏】

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 有时web应用会打开多个浏览器窗口&#xff0c;当我们要定位新窗口中的元素时&#xff0c;我们需要将webDriver的handle&#xff08;句柄&#xff09;指定到新窗口…

js基础-作用域与作用域链

什么是作用域&#xff1f; 简单说就是在代码中定义的变量或者函数能起作用的范围 什么是作用域链&#xff1f; 简单说就是JavaScript 在执行时查找变量的过程&#xff0c;它按照从当前作用域到全局作用域的顺序逐层向上搜索&#xff0c;直到找到变量或到达作用域的顶…

精美UI三方用户中心 新版QRuser用户中心主题 | 魔方财务模板

内容目录 一、详细介绍二、效果展示1.部分代码2.效果图展示 三、学习资料下载 一、详细介绍 新版QRuser用户中心主题 | 魔方财务模板 本主题支持魔方财务3.5.7版本&#xff01;可自由切换魔方财务3.5.7版本与其他版本。 本主题基于官方default开发&#xff0c;主要面向企业&…

《python语言程序设计》2018版第6章第27题双素数是指一堆差值为2的素数。

水平的原因做不到答案那种输出 def is_prime(number):divisor 2while divisor < number / 2:if number % divisor 0:return Falsedivisor 1return Truedef print_prime_numbers(number_of_primes):count 0number 2while number < number_of_primes:if is_prime(numb…

Node Red 与axios简易测试环境的搭建

为了学习在vue3中如何使用axios&#xff0c;我借Sider Fusion的帮助搭建了基于node的简易测试环境。 Axios 是一个基于 Promise 的 HTTP 客户端&#xff0c;通常用于浏览器环境&#xff0c;但它也可以在 Node.js 环境中使用。因此&#xff0c;可以在 Ubuntu 的 Bash 环境下通过…

3DsMax展开管道UV,展开圆柱体UV,展开带有拐弯部分的UV

效果 3dsmax展开管道的UV 创建管道 创建样条线 制作弯曲部分 打开样条线先的顶点&#xff0c;选择样条线的顶点&#xff0c;不选中&#xff0c;开头和结尾的顶点&#xff0c;点击圆角 &#xff0c;鼠标移动到顶点上&#xff0c;左键点击顶点然后向上拖拽。 设置样条线可渲染…

JavaScript和vue实现左右两栏,中间拖动按钮可以拖动左右两边的宽度

JavaScript实现&#xff1a; <!DOCTYPE html> <html lang"en"> <head><title>拖动效果</title><style> body, html {margin: 0;padding: 0;height: 100%;font-family: Arial, sans-serif; }.container {display: flex;height: …

element-ui简单入门1.0.0

第一篇&#xff1a;table标签速用 总结&#xff1a;建楼前&#xff0c;先打地基<el-table></el-table>&#xff0c;打完地基看高度&#xff0c;一层楼4米&#xff0c;80米20个<el-table-column></el-table-column>&#xff0c;每次楼的名字是label 第…

HDFS常用命令

HDFS常用命令 1.HDFS命令介绍1.1基本语法格式1.2常用命令 1.HDFS命令介绍 HDFS 提供了一组命令行工具&#xff0c;用于管理和操作 HDFS 文件系统。 1.1基本语法格式 hdfs dfs -<命令> [选项] <参数>1.2常用命令 1.显示<path>指定的文件的详细信息。 had…

webpack打包发布~

1、安装webpack&#xff08;局部安装webpack&#xff09;。 npm i webpack webpack-cli -D 2、安装成功之后&#xff0c;你会在package.json文件中看到这个。 3、新建webpack.config.js文件&#xff0c;里面写配置编译模式&#xff0c;入口出口等&#xff08;这里演示的是单入…

C语言——求阶乘的两种方法

第一种方法使用了递归思想 #include <stdio.h> int fun(int N) {if (N 0){return 1;}else{return (fun(N - 1) * N);} } int main() {int N 0;scanf_s("%d", &N);printf("%d",fun(N)); } 第二种方法用的for循环 #include <stdio.h> i…

《计算机网络》(第8版)第1章 概述 复习笔记

第 1 章 概述 一、计算机网络在信息时代中的作用 计算机网络的两个重要功能&#xff1a; 1 &#xff0e;连通性 指互联网上的用户之间是相互连通的。 2 &#xff0e;共享&#xff08;资源共享&#xff09; 资源共享可以是信息共享、软件共享&#xff0c;也可以是硬件共享。此…

RHCSA第一次作业

目录 1、创建以上目录和文件结构&#xff0c;并将/yasuo目录拷贝4份到/目录下 2、查看系统合法shell 3、查看系统发行版版本 4、查看系统内核版本 5、临时修改主机名 6、为/yasuo/ssh_config文件创建软链接/ssh_config.link到/mulu下 7、创建目录/mulu ,重命名并移动/ss…

计算机网络学习:TCP握手挥手强制连接中断

之前系统学习过TCP协议&#xff0c;但很多地方并不是特别清晰&#xff0c;今天结合抓包情况&#xff0c;再拾一下拾一下>.< 首先看一下TCP数据包的标志位&#xff1a; SYN&#xff1a;简写为S&#xff0c;同步标志位&#xff0c;用于建立会话连接&#xff0c;同步序列号…