点估计之矩估计
- 👻什么是参数估计
- 👻引例---理解参数估计
- 🐟点估计
- 🍭引例
- 🍭点估计问题
- 🐟矩估计
- 🍭预备知识
- 🍭矩估计的求解步骤
- 🍭矩估计例题
👻什么是参数估计
在一些实际问题中,研究对象的总体分布类型可以从理论或实际经验得到,但总体参数常常是未知的,需利用样本提供的信息对未知参数做出估计,其分布函数才能完全确定。例如,根据中心极限定理或实际经验知道,采用新工艺生产的一批电子元件的寿命X服从正态分布N(μ, σ2),但它的参数μ和σ2未知,需要我们利用样本提供的信息去估计μ和σ2,这就提出了参数的估计问题。
另外一些实际问题,我们并不关心总体X的分布类型,仅关心总体的某些数字特征。例如,全国农产量抽样调查,我们关心的是全国在一定收获季节各种农作物的平均亩产量和总产量,也需要通过样本信息去估计。由于随机变量的数字特征与它的概率分布中的参数有一定的关系,因而对数字特征的估计也称参数估计。
参数估计有两种基本形式——点估计和区间估计。
故参数估计内容概略如下:
👻引例—理解参数估计
为了更好的理解,我们先提出问题,举个例子,明确我们参数估计所要研究的问题。
研究方法为点估计和区间估计,点估计是对未知参数做出估计,给出一个估计的确切值。而区间估计则是给出未知参数的一个可能的范围。并且区间估计还会给出我们未知参数的真实值落在这个区间的可信程度。
除此之外,我们还可以进行假设检验。我们可以根据过往的经验得出我们的假设,并根据我们现有的这组样本来进行验证。
显而易见,相比点估计,区间估计是更加严谨的。本次我们主要研究点估计,而研究点估计有两种常用的方法对参数进行估计——矩估计和极大似然估计。本次我们主要看其中的矩估计。
🐟点估计
🍭引例
首先,我们先看一个引例:
🍭点估计问题
点估计问题:
设总体 X X X的分布函数(概率密度,分布律)的形式已知,但它的一个或多个参数未知,借助于总体 X X X的一个样本来 估计总体未知参数的问题,称为参数的点估计问题。
点估计问题的提出:
已知:总体 X X X的分布函数 F ( x , θ ) F(x,θ) F(x,θ)的形式。
未知:θ待估参数。
利用: X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn是 X X X的一个样本, x 1 , x 2 , . . . x n x_1,x_2,...x_n x1,x2,...xn是相应的一个样本值。
点估计问题:
构造一个适当的统计量 θ ^ ( X 1 , X 2 , . . . X n ) , \hat{θ}(X_1,X_2,...X_n), θ^(X1,X2,...Xn),用它的观测值 θ ^ ( x 1 , x 2 , . . . x n ) \hat{θ}(x_1,x_2,...x_n) θ^(x1,x2,...xn)作为未知参数 θ θ θ的近似值。
称 θ ^ ( X 1 , X 2 , . . . X n ) \hat{θ}(X_1,X_2,...X_n) θ^(X1,X2,...Xn)为 θ {θ} θ的估计量。(注意,这是一个函数!)
称 θ ^ ( x 1 , x 2 , . . . x n ) \hat{θ}(x_1,x_2,...x_n) θ^(x1,x2,...xn)为 θ θ θ的估计值。(注意,这是一个值!)
注:
(1)称估计量和估计值为估计。
(2)由于估计量是样本的函数,对不同的样本值,估计值一般不同。
🐟矩估计
🍭预备知识
对于总体 X X X,我们可以知道总体 X X X的k阶原点矩,即
E ( X k ) , k = 1 , 2 , . . . , n E(X^k),k=1,2,...,n E(Xk),k=1,2,...,n
特别地,我们可以得知, X X X的一阶矩: E ( X ) E(X) E(X),以及 X X X的二阶矩 E ( X 2 ) E(X^2) E(X2)。
在参数估计一章,一般地,我们不知道总体 X X X的数字特征,所以需要从得到的样本来反映总体的特征。
对于我们所得到的一组样本 x 1 , x 2 , . . . x n x_1,x_2,...x_n x1,x2,...xn而言,我们可以定义样本的k阶原点矩。
我们定义样本的 k k k阶原点矩如下:
A k = 1 n ∑ i = 1 n X i k , k = 1 , 2 , . . . , n A_k=\frac{1}{n}\sum_{i=1}^nX_i^k,k=1,2,...,n Ak=n1i=1∑nXik,k=1,2,...,n
特别地,样本的一阶矩: A 1 = X ‾ = 1 n ∑ i = 1 n X i A_1=\overline X=\frac{1}{n}\sum_{i=1}^nX_i A1=X=n1i=1∑nXi
样本的二阶矩: A 2 = 1 n ∑ i = 1 n X i 2 A_2=\frac{1}{n}\sum_{i=1}^nX_i^2 A2=n1i=1∑nXi2
我们构造样本k阶原点矩的原因在于,样本的k阶原点矩蕴含了总体的k阶原点矩的信息,所以我们可以根据样本的信息,去近似估计总体。
理论依据:样本的k阶矩依概率收敛于总体的k阶矩,即
A k = 1 n ∑ i = 1 n X i k ⟶ p = E ( X k ) , ( k = 1 , 2 , . . . , n ) A_k=\frac{1}{n}\sum_{i=1}^nX_i^k\longrightarrow ^p =E(X^k),(k=1,2,...,n) Ak=n1i=1∑nXik⟶p=E(Xk),(k=1,2,...,n)
即: n → ∞ n\rightarrow \infty n→∞时,可用 A k A_k Ak近似估计 E ( X k ) E(X^k) E(Xk)
特别地:
A 1 = X ‾ ⟶ E ( X ) A_1=\overline X \longrightarrow E(X) A1=X⟶E(X),即有 X ‾ = E ( X ) \overline X=E(X) X=E(X)
A 2 = 1 n ∑ i = 1 n X i 2 ⟶ E ( X 2 ) A_2=\frac{1}{n}\sum_{i=1}^nX_i^2 \longrightarrow E(X^2) A2=n1∑i=1nXi2⟶E(X2),即有 1 n ∑ i = 1 n X i 2 = E ( X 2 ) \frac{1}{n}\sum_{i=1}^nX_i^2 = E(X^2) n1∑i=1nXi2=E(X2)
🍭矩估计的求解步骤
设总体 X X X的分布中含有m个未知参数 θ 1 , θ 2 , θ 3 , . . . , θ m \theta_1,\theta_2,\theta_3,...,\theta_m θ1,θ2,θ3,...,θm,
1.求总体的各阶矩 E ( X k ) ( k = 1 , 2 , . . . m ) ; E(X^k)(k=1,2,...m); E(Xk)(k=1,2,...m);
2.令样本的各阶矩等于总体的各阶矩,得到含有m个未知参数 θ 1 , θ 2 , . . . , θ m \theta_1,\theta_2,...,\theta_m θ1,θ2,...,θm的方程;
解上述方程,所求得的解 θ ^ k ( X 1 , X 2 , . . . , X n ) \hat \theta_k(X_1,X_2,...,X_n) θ^k(X1,X2,...,Xn)称为未知参数 θ k \theta_k θk的矩估计量,简称矩估计。
注:
[1]总体中有几个未知参数,就建立几个方程;
[2]常用的一个公式, E ( X 2 ) = D ( X ) + E 2 ( X ) E(X^2)=D(X)+E^2(X) E(X2)=D(X)+E2(X)
🍭矩估计例题
求解如下:
这里用到的知识点以及需要注意的点有:
①明确均匀分布U,知道均匀分布的性质,均值以及方差,以及密度函数
②未知参数有a,b两个,故需要列两个方程求解
③利用总体的一阶原点矩和样本的一阶原点矩近似相等,和总体的二阶原点矩和样本的二阶原点矩近似相等进行求解。
④将经常用到的公式,即求解二阶原点矩,利用均值和方差这两个很常用的数字特征可得,一定要熟记于心。
⑤分清估计值和估计量的概念,估计量是一个关于样本的函数,而估计值是根据样本观测值得到得确切的值。