保研面试/考研复试概率论与数理统计问题整理

1. 古典概型、几何概型

  • 古典概型——有限等可能(有限个可能事件,且每个事件都是等可能概率事件)
  • 几何概型——无限等可能

2. 条件概率

P ( B ) > 0 P(B)>0 P(B)>0,称 B B B 发生的条件下, A A A 发生的概率为条件概率,且 P ( A ∣ B ) = P ( A B ) P ( B ) P(A|B)=\frac{P(AB)}{P(B)} P(AB)=P(B)P(AB).

3. 全概率公式

在这里插入图片描述在这里插入图片描述

B 1 , B 2 , … B n B_1,B_2,… B_n B1,B2,Bn Ω Ω Ω 的一个完备事件组,则对任一事件 A A A ,有 P ( A ) = ∑ ( i = 1 ) n P ( B i ) P ( A ∣ B i ) P(A)=∑_{(i=1)}^n P(B_i )P(A|B_i) P(A)=(i=1)nP(Bi)P(ABi).

4. 贝叶斯公式

贝叶斯本质就一个条件概率公式 P ( A ∣ B ) P(A|B) P(AB),也就是在 B B B 事件发生的情况下, A A A 事件发生的概率。
在这里插入图片描述在这里插入图片描述

5. 什么是先验概率?

事情未发生,只根据以往数据统计,分析事情发生的可能性,即先验概率。

指根据以往经验和分析。在实验或采样前就可以得到的概率。

先验概率是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现。

6. 什么是后验概率?与先验概率的关系?

1) 后验概率

事情已发生,已有结果,求引起这事发生的因素的可能性,由果求因,即后验概率。

指某件事已经发生,想要计算这件事发生的原因是由某个因素引起的概率。

后验概率是指依据得到"结果"信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是"执果寻因"问题中的"因"。

2) 与先验概率的关系

后验概率的计算,是以先验概率为前提条件的。如果只知道事情结果,而不知道先验概率(没有以往数据统计),是无法计算后验概率的。

后验概率的计算需要应用到贝叶斯公式。

7. 全概率公式、贝叶斯公式与先验、后验概率的关系?

全概率公式,总结几种因素,事情发生的概率的并集。由因求果。

贝叶斯公式,事情已经发生,计算引起结果的各因素的概率,由果寻因。同后验概率。

全概率是用原因推结果,贝叶斯是用结果推原因。

8. 离散型随机变量的常见分布

在这里插入图片描述

1) 伯努利分布\两点分布\0-1分布 X ∼ B ( 1 , p ) X∼B(1,p) XB(1,p)

P ( X = 0 ) = 1 − p , P ( X = 1 ) = p , p ∈ ( 0 , 1 ) P(X=0)=1-p, P(X=1)=p, p∈(0,1) P(X=0)=1p,P(X=1)=p,p(0,1)

2) 二项分布(伯努利概型) X ∼ B ( n , p ) X∼B(n,p) XB(n,p)

P ( X = k ) = C n k p k ( 1 − p ) n − k , p ∈ ( 0 , 1 ) , k = 0 , 1 , … , n P(X=k)=C_n^k p^k (1-p)^{n-k}, p∈(0,1), k=0,1,…,n P(X=k)=Cnkpk(1p)nk,p(0,1),k=0,1,,n
N N N 次独立重复的伯努利试验中成功的次数 X X X 服从二项分布。

3) 泊松分布 X ∼ P ( λ ) X∼P(λ) XP(λ)

P ( X = k ) = λ k e − λ k ! , λ > 0 , k = 0 , 1 , 2 , … P(X=k)=\frac{λ^k e^{-λ}}{k!}, λ>0, k=0,1,2,… P(X=k)=k!λkeλ,λ>0,k=0,1,2,
泊松分布适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内受到的服务请求的次数,电话交换机接到呼叫的次数、汽车站台的候客人数、机器出现的故障数、自然灾害发生的次数、DNA序列的变异数、放射性原子核的衰变数、激光的光子数分布等等。

4) 几何分布 X ∼ G ( p ) X∼G(p) XG(p)

P ( X = k ) = ( 1 − p ) ( k − 1 ) p , p ∈ ( 0 , 1 ) , k = 1 , 2 , … P(X=k)=(1-p)^{(k-1)} p, p∈(0,1), k=1,2,… P(X=k)=(1p)(k1)p,p(0,1),k=1,2,

首次试验成功所需做的试验次数 X X X 服从几何分布。

5) 超几何分布

超几何分布(Hypergeometric distribution)描述了由有限个对象中抽出 n n n 个对象,成功抽出 k k k 次指定种类的对象的概率(抽出不放回(without replacement))。
P ( X = k ) = C K k C N − K n − k C N n , 0 < k < m i n { K , n } P(X=k)=\frac{C_K^k C_{N-K}^{n-k}}{C_N^n },0<k<min\{K,n\} P(X=k)=CNnCKkCNKnk,0<k<min{K,n}
在这里插入图片描述

9. 连续型随机变量的常见分布

在这里插入图片描述

1) 均匀分布 X ∼ U ( a , b ) X∼U(a,b) XU(a,b)

f ( x ) = { 1 b − a a < x < b 0 o t h e r f(x)=\begin{cases}\frac{1}{b-a}&a<x<b\\0&other\end{cases} f(x)={ba10a<x<bother

2) 指数分布 X ∼ E ( λ ) X∼E(λ) XE(λ)

f ( x ) = { λ e − λ x x > 0 0 o t h e r f(x)=\begin{cases}λe^{-λx}&x>0\\0&other\end{cases} f(x)={λeλx0x>0other

3) 正态分布\高斯分布 X ∼ N ( μ , σ 2 ) X∼N(μ,σ^2) XN(μ,σ2)

f ( x ) = 1 √ 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < ∞ f(x)=\frac{1}{√2π σ} e^{-\frac{(x-μ)^2}{2σ^2}}, -∞<x<∞ f(x)=2πσ1e2σ2(xμ)2,<x<
特别地,当 μ = 0 , σ = 1 μ=0, σ=1 μ=0,σ=1 时为标准正态分布, X ∼ N ( 0 , 1 ) X∼N(0,1) XN(0,1) .
在这里插入图片描述

10. 若干正态分布相加、相乘后得到的分布分别是什么?

(独立的前提下)都服从正态分布
在这里插入图片描述

11. 数学期望、方差

1) 数学期望

随机变量的均值(不同于样本均值),大数定律指出如果样本足够的话,样本均值会无限接近数学期望。

数学期望(mean)(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。

2) 方差

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。

方差是衡量源数据和期望值相差的度量值
D ( X ) = E ( ( X − E ( X ) ) 2 ) = E ( X 2 ) − E 2 ( X ) D(X)=E((X-E(X))^2)=E(X^2)-E^2(X) D(X)=E((XE(X))2)=E(X2)E2(X) (平方的期望-期望的平方)

12. 相关系数、协方差

1) 协方差

期望值分别为 E [ X ] E[X] E[X] E [ Y ] E[Y] E[Y] 的两个实随机变量 X X X Y Y Y 之间的协方差 C o v ( X , Y ) Cov(X,Y) Cov(X,Y) 定义为:在这里插入图片描述

即: X , Y X, Y X,Y 的协方差等于每一个 X X X 减去 X X X 平均值乘上每一个 Y Y Y 减去 Y Y Y 平均值的乘积的和的平均数。

从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。

从直观上来看,协方差表示的是两个变量总体误差的期望。

如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值时另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值时另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

2) 相关系数

定义在这里插入图片描述称为随机变量 X X X Y Y Y 的(Pearson)相关系数。

即:用 X 、 Y X、Y XY 的协方差除以 X X X 的标准差和 Y Y Y 的标准差。

相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差。它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。

3) 相关系数或协方差为0的时候能否说明两个分布无关?为什么?

只能说明不线性相关,不能说明无关。因为在数学期望存在的情况下,独立必不相关,不相关未必独立。

13. 独立和互斥的关系?

在这里插入图片描述

14. 独立和不相关的区别?

不相关就是两者没有线性关系,但是不排除其它关系存在;独立就是互不相干没有关联

在这里插入图片描述(cov 协方差)

在数学期望存在的情况下,独立必不相关,不相关未必独立。

15. 大数定律

随机变量的均值依概率收敛于自己的期望。

大数定律通俗一点来讲,就是样本数量很大的时候,样本均值和数学期望充分接近,也就是说当我们大量重复某一相同的实验的时候,其最后的实验结果可能会稳定在某一数值附近。就像抛硬币一样,当我们不断地抛,抛个上千次,甚至上万次,我们会发现,正面或者反面向上的次数都会接近一半,也就是这上万次的样本均值会越来越接近 50 % 50\% 50% 这个真实均值,随机事件的频率近似于它的概率。

在这里插入图片描述

实验次数越多,样本均值趋向于总体的均值。大数定理将属于数理统计的平均值和属于概率论的期望联系在了一起。

在这里插入图片描述

16. 切比雪夫大数定律

X 1 , X 2 , … , X n X_1,X_2,…,X_n X1X2Xn 独立期望 E X k EX_k EXk方差 D X k DX_k DXk 都存在,且方差 D X k DX_k DXk 有一致上界(即每个方差都有上界且收敛速度接近),则对任意 ε > 0 ε >0 ε>0,有: 在这里插入图片描述. (不要求同分布)

17. 中心极限定理

大量( n → ∞ n→∞ n)、独立、同分布的随机变量之和,近似服从于一维正态分布。

n n n 个独立同分布的随机变量,当 n n n 充分大时,其均值服从正态分布。(大量独立同分布的随机变量之和近似服从一维正态分布。)

中心极限定理是说当样本数量无穷大的时候,样本均值的分布呈现正态分布。

实验次数越多,样本均值的分布越趋向于正态分布。

中心极限定理指的是给定一个任意分布的总体。每次从这些总体中随机抽取 n n n 个抽样,一共抽 m m m 次。 然后把这 m m m 组抽样分别求出平均值。这些平均值的分布接近正态分布。

18. 大数定律和中心极限定理的区别

前者更关注的是样本均值,后者关注的是样本均值的分布,比如说掷色子吧,假设一轮掷色子 n n n 次,重复了 m m m 轮,当 n n n 足够大,大数定律指出这 n n n 次的均值等于随机变量的数学期望,而中心极限定理指出这 m m m 轮的均值分布符合围绕数学期望的正态分布。

19. 最大似然估计(极大似然估计)是什么?

极大似然估计就是一种参数估计方法。

最大似然估计的目的是:利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值

原理:极大似然估计是建立在极大似然原理的基础上的一个统计方法,是概率论在统计学中的应用。极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。通过若干次试验,观察其结果,利用试验结果得到某个参数值能够使样本出现的概率为最大,则称为极大似然估计。

方程的解只是一个估计值,只有在样本数趋于无限多的时候,它才会接近于真实值。

  • 求最大似然估计量 θ ^ \widehat \theta θ 的一般步骤:

    [1] 写出似然函数;
    [2] 对似然函数取对数,并整理;
    [3] 求导数;
    [4] 解似然方程。

  • 最大似然估计的特点:

    [1] 比其他估计方法更加简单;
    [2] 收敛性:无偏或者渐近无偏,当样本数目增加时,收敛性质会更好;
    [3] 如果假设的类条件概率模型正确,则通常能获得较好的结果。但如果假设模型出现偏差,将导致非常差的估计结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/64776.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机考研复试面试题专业知识整理

目录 常考题1、抽象类和接口的区别2、什么时候用抽象类或接口3、Java跨平台怎么实现4、软件工程的各阶段及需求分析的任务和作用5、进程与线程6、主存的分类7、SRAM和DRAM的区别8、多线程通信如何保证9、c静态成员的作用&#xff1f;你写过的代码怎么使用的&#xff1f;10、c构…

计算机考研复试面试常问问题 数据结构篇(上)

计算机考研复试面试常问问题 数据结构篇&#xff08;上&#xff09; 使用前需知&#xff08;拒绝白嫖&#xff0c;如果对你有帮助&#xff0c;你只需点个赞就行&#xff09;&#xff1a; 需要pdf直接打印版&#xff0c;可在公众号"程序员宝藏"回复复试上岸获取(会持…

对正在准备2022年哈尔滨工程大学计算机类考研复试的考生的一些建议

1. 概要 在2021年&#xff0c;哈尔滨工程大学计算机类考研复试是在线上进行的&#xff0c;使用的学信网的复试系统。主要是分为以下几个部分&#xff1a;中文自我介绍、英文自我介绍和英语翻译、两门专业课的选择题、程序阅读题、思想品德问答和工程实践问答。 2. 复试需要准…

计算机面试(考研复试)问题整理

中科大复试准备 数据结构->操作系统->计算机网络->通信原理->微机原理-> 软件工程&#xff0c;编译原理&#xff0c;数据库 计算机考研复试整理 PDF文件自取 数据结构 1. 时间复杂度 时间复杂度是指执行算法所需要的计算工作量&#xff0c;因为整个算法的执行…

计算机考研复试整理

这些是我在复试时&#xff0c;自己搜集的一些资料&#xff0c;加自己的理解&#xff0c;有许多不足或有错误的地方&#xff0c;好像还有好多错别字&#xff0c;大家看看就好&#xff01;&#xff01;&#xff01; 1、基本分页管理与基本分段管理的区别。 应该比较简单 但还是…

计算机考研复试面试题整理

考研复试面试题整理 文章目录 前言数据结构部分操作系统部分计算机网络部分CJAVA编译原理软件工程排序算法专题 前言 笔者刚刚参加完2022年考研复试&#xff0c;现将复试过程中自己整理的部分面试题整理出来&#xff0c;仅供参考。 数据结构部分 1.数据结构按逻辑结构可以分为…

chatgpt赋能python:Python关键字详解

Python关键字详解 Python是一种高级编程语言&#xff0c;是一种被广泛应用于各种领域的脚本语言。Python具有简洁、易读、易维护等优点&#xff0c;受到了全球程序员的喜爱。Python的关键字是其语言的重要组成部分&#xff0c;本篇文章将介绍Python的关键字&#xff0c;并详细…

chatgpt赋能python:Python关键字yield介绍

Python关键字yield介绍 Python语言的关键字yield&#xff0c;虽然比较简单&#xff0c;但是在实际编程中非常常见且重要。在这篇文章中&#xff0c;我们将介绍yield的定义及其在生成器函数中的作用。我们还将深入探讨yield的用法和优点&#xff0c;以及如何将其应用到实际代码…

chatgpt赋能python:Python关键字raise详解

Python关键字raise详解 在Python编程中&#xff0c;raise是一个非常重要的关键字。它能够帮助开发者在程序运行过程中检测到错误或异常&#xff0c;并进行相应的处理。本文将对raise关键字进行详细介绍&#xff0c;帮助开发者更好地理解和应用该关键字。 raise关键字的作用 …

chatgpt赋能python:Python关键字总结

Python关键字总结 **Python关键字&#xff08;Keywords&#xff09;**是在编程语言中有特定含义的预定义标识符。在Python中&#xff0c;有35个关键字用于表示特定含义的标识符。 Python中的关键字列表 以下是Python中的所有关键字列表&#xff1a; and as assert…

chatgpt赋能python:Python关键字查询方法

Python关键字查询方法 在Python编程中&#xff0c;关键字是指具有特殊含义和用途的保留字&#xff0c;不能被用作变量名、函数名等标识符。Python语言目前共有35个关键字。 如果你是一名Python开发者或学习者&#xff0c;有时候需要查询某个标识符是否是Python的关键字。本文…

chatgpt赋能python:Python关键字搜索优化指南

Python 关键字搜索优化指南 如果你是一个 Python 工程师&#xff0c;你可能常常面临一些需要优化的问题。在这些问题中&#xff0c;其中一个重要的问题就是搜索引擎的优化。为了让你的 Python 相关网站更容易被搜索引擎找到&#xff0c;你需要进行关键字的搜索优化。 什么是搜…

目标检测算法——将xml格式转换为YOLOv5格式txt

深度学习Tricks&#xff0c;第一时间送达 XML:即可扩展标记语言&#xff0c;XML全称是Extensible Markup Language&#xff0c;中文译为可扩展的标记语言&#xff0c;它是SGML&#xff08;标准通用标记语言&#xff09;的一个子集&#xff0c;与hxml文件不同的是&#xff0c; X…

单品GMV破千万,这些品类正在抖音热卖

优势品类及核心产品能更好触达消费者&#xff0c;以较低的成本让用户感知品牌&#xff0c;塑造品牌力。 抖音作为品牌最核心的线上渠道之一&#xff0c;该如何找到平台优势品类&#xff1f;制定品牌营销策略&#xff1f;有效提升产品销量呢&#xff1f; 近期&#xff0c;新抖上…

弘辽科技:抖音带货如何提高流量转化率

抖音带货最核心的问题就是提高转化率。一个视频发布后&#xff0c;用户点开你的商品链接并且下单了&#xff0c;就产生了转化。 那么&#xff0c;短视频带货转化的秘诀是什么呢&#xff1f; 一、人物 1、打造独特IP 想要提高抖音带货转化率&#xff0c;打造清晰的人设和年轻化…

从TikTok功能优化,抓住直播带货机遇

从今年流出的各类消息总结&#xff0c;TikTok的发展势头愈发迅猛&#xff0c;无论是布局东南亚各个站点&#xff0c;还是在其下载量的激增&#xff0c;都迸发出了前所未有的劲头&#xff0c;其对本身的优化也一直在进行。 那么今年&#xff0c;TikTok都进行了哪些功能优化呢&am…

2023 首发 新版 抖音权重查询接口源码v2.1 附接口

最近爆火的抖音权重限流查询&#xff0c;输入抖音主页链接即可查询作品情况&#xff0c;不清楚的兄弟可以去抖音搜索“权重”看直播间&#xff0c;一场直播都是几万票&#xff0c;折算下来几千&#xff0c;赶快抓住风口吃肉。目前后台系统已经写好&#xff0c;可以会员登陆卡密…

抖音10月的带货风向是什么?

站内大促氛围火爆&#xff0c;双十一好物节加持下&#xff0c;又有哪些亮眼主播、热卖商品和出圈品牌呢&#xff1f;通过新抖统计的10月1日-10月31日的月榜数据&#xff0c;一起来了解看看吧。 01 30主播带货破亿 东方甄选蝉联榜首 据新抖「主播带货榜」数据显示&#xff0c;…

抖音+微信混搭玩法,打造新私域商业飞轮

私域运营概念从2019年开始提及&#xff0c;由于能够带来“更深度的品牌认同”以及“更增量的获客效果”&#xff0c;现已被各大企业纳入战略级计划。 最开始&#xff0c;私域运营基于微信社交关系链&#xff0c;被很多人认为是微信群运营的代名词&#xff0c;而后演变为公众号…

香橙派借助语音模块实现语音刷抖音

项目介绍&#xff1a; 本项目使用su-03t语音模块进行语音识别&#xff0c;将识别到的结果发送给香橙派&#xff0c;再由香橙派对语音模块发送的结果进行解析&#xff0c;最后发送指令对手机进行控制。 硬件介绍&#xff1a; ①&#xff1a;香橙派作为主控 ②&#xff1a;语音…