一、二维
1、二维随机变量及其分布
假设E是随机试验,Ω是样本空间,X、Y是Ω的两个变量;(X,Y)就叫做二维随机变量或二维随机向量。X、Y来自同一个样本空间。
联合分布函数 F(x,y)=P(X≤x,Y≤y),即F(x,y)表示求(x,y)左下方的面积。 F(x,y) 不减,例如:y固定,x1<x2,F(x1,y)<F(x2,y);F(x,y)分别关于x和y右连续。
对于<,< 存在 P(< X ≤ , <Y ≤ ) = F(,) - F(,)-F(,)+F(,)
P(< X ≤ , <Y ≤ ) 如左下图表示,等号右边则是图中四块区域的代表。
2、二维离散型随机变量的联合分布和边缘分布
边缘分布 是表示在所有可能的一个变量值上,获取另一个变量的概率之和
X的边缘分布:(x) = P(X ≤ x) = F(x,+∞) = P(X≤x,Y<+∞)
Y的边缘分布:(y) = P(Y ≤ y) = F(+∞,y) = P(X<+∞,Y≤y)
联合概率质量函数 P(X=x,Y=y) 描述了随机变量 X 和 Y 同时取特定值 x 和y 的概率。所有可能的 x 和 y 值的概率之和等于1。
3、二维连续随机变量的联合密度和边缘密度函数
F(x,y) = P(X≤x,Y≤y) = f(s,t) ds dt 函数就是对所有的x,y进行积分求和。
例如: 已知联合密度函数,求分布函数F(x,y)
解:带入分布函数公式: f(s,t) ds dt = dx dy = dx dy =(1-)(1-) ;因为联合密度函数定义域为x,y都大于0,所以积分时只需要大于0即可
边缘密度函数 直接将另一个变量积分部分等价于(x,+),则剩下部分为另一个变量的边缘密度函数。
二、条件分布
1、基础定义
已知另一个随机变量或事件的条件下,该随机变量的概率分布:F(x|A)=P(X x | A)
例如:概率密度函数如图,求在X>1的条件下f(x)的条件分布函数
解:F(x | X>1) = P(X x|X>1)=P(X x,X>1)/ P(X>1)
求分子:P(1 X x) = 1/ dx = 1/ * arctan(x) = arctan(x)/ - 1/4
求分母:P(X>1) = 1/ = 1/ * arctan(x) = 1/ * /2 - 1/ * /4 = 1/4
则整个结果为 (arctan(x)/ - 1/4)/1/4=arctan(x)/ -1
2、离散型随机变量的条件分布
从分布表来理解
X\Y | 0 | 1 |
---|---|---|
0 | 0.1 | 0.3 |
1 | 0.3 | 0.3 |
P(Y=y) 是 Y 的边缘概率质量函数,Y 的边缘概率质量函数是对列求和:
Y | 0 | 1 |
---|---|---|
P | 0.4 | 0.6 |
那么在Y=1的条件下,假设x=0,X=x的概率为: P(X=0∣Y=1)=03/0.6 =0.5;假设x=1,X=x的概率为 P(X=1∣Y=1)=0.3/0.6=0.5
3、连续型随机变量的条件分布
Y=y条件下,条件概率密度函数为: f(x∣y)=f(x,y) / (y);同理X=x条件下:f(y∣x)=f(x,y) / (x)。其中(y) 、(x) 是边缘函数。
例如:假设
解:f(x|y) = f(x,y) / (y) = 1/(1+)(1+) / 1/(1+) = 1/(1+)
f(y|x) = f(x,y) / (x) = 1/(1+)(1+) / 1/(1+) = 1/(1+)
三、随机变量独立性
概率密度函数f(x,y)可以表示为各自边缘概率密度函数的乘积:
离散型 :P(X=x,Y=y)=P(X=x)⋅P(Y=y)
连续型:f(x,y)=(x)⋅(y)
四、二维随机变量函数的分布
1、离散型
第一步:列出所有x与y结合的取值点 (例如:z=x+y)
第二步:根据联合概率质量 函数 P(X=x,Y=y) 求z的值分布及其概率
第三步;全部z点相加验证是否等于1
例如:
假设有两个离散型随机变量 XX 和 YY,它们的联合PMF如下表所示:
X \ Y | 1 | 2 | 3 |
---|---|---|---|
1 | 0.1 | 0.2 | 0.0 |
2 | 0.0 | 0.3 | 0.0 |
3 | 0.1 | 0.1 | 0.2 |
第一步:列出所有z点 (P(1,1) ,P(1,2),P(1,3),P(2,1),P(2,2),P(2,3),P(3,1),P(3,2),P(3,3)
第二步:根据点得到对应概率,并根据(z=x+y)的求得Z点数值
Z2=P(1,1) = 0.1
Z3=P(1,2)+P(2,1) = 0.2+0.0 = 0.2
Z4=P(1,3)+P(2,2)+P(3,1) =0.0+0.3+0.1=0.4
Z5=P(2,3)+P(3,2)=0.0+0.1=0.1
Z6=P(3,3)=0.2
第三步:根据得到所有点概率进行求和验证 Z2+Z3+Z4+Z5+Z6 =0.1+0.2+0.4+0.1+0.2=1
2、连续型
第一步:明确要求需要什么函数(分布函数、概率密度函数)
第二步:根据联合密度函数进行(x,y)积分得到 分布函数,在进行 求导得到z的概率密度函数
(z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy ; (z)=d/dz * (z)
例如:假设 (X,Y) 的联合概率密度函数为下图, 求Z=X+Y的分布
解:
第一步:求分布函数,根据z=x+y 以及函数信息得到 z在(x,y)的分布 => 直角坐标系 点(1,1)、(1,0)、(0,1)、(0,0),四个点所在的长方形,线条z=x+y 也就是点(2,0)、(0,2)、(0,0)三点的三角形区域,两块面积的区域交集部分就是z在直角坐标系的投影;根据x,y的值获得z的分布区间(0,2),由于z在(0,1)区间是符合x,y的区间随意落地,可以直接使用积分函数求解;z在(1,2)区间内只能在长方形减去右上三角面积的结果
第二步:对(0,1)进行积分 :根据 联合密度函数进行积分布函数 (z)= P(Z ≤ z)=P ( g(X,Y) ≤z ) =≤z f(x,y) dx dy = dx 2 dy = 2y dx = 2(z-x) dx =2zx - =
对(1,2):由于是得到面积,所以不需要积分为 1-/2
第三步:汇总结果 形成分布函数
总结:连续型可直接根据图形面积汇总(x和y的随意分布形状与联合函数区域不一致),若在一致情况下可求面积也可以求积分得到分布函数,再根据分布函数求导得到概率密度函数。