Beta分布可以用于拟合各种不同的分布,网上各种资料对于Beta分布的原理着墨较多,却少有推导Beta分布公式的,所以,推导Beta分布公式如下:
设一组随机变量 ,将这n个随机变量排序后得到顺序统计量 ,计算落在区间 的概率,即求概率值 。将区间[0,1]分为三段 , , 。考虑简单情形,假设n个数中只有一个落在了区间 内。因为样本 是第i大的,则 中应该有i-1个数, 这个区间中应该有n-k个数。先考虑一个符合上述条件的事件E。
则有:
考虑较为复杂的情形,假设n个数中有两个数落在了区间 ,
则有:
从以上分析可以看出,只要落在 内的数字超过一个,则对应事件的概率就是 ,于是:
所以,可以得到 的概率密度函数为:
利用Gamma函数,可以把 表达为
取 , ,于是得到:
此即为标准Beta分布的概率密度函数。更为一般的 分布概率密度函数为:
=
式中:
,
称 服从贝塔分布,简记为 。
形状参数 的表达式为:
式中, 为 的均值, 为 的方差。
通过 和 控制Beta分布概率密度函数的形状,可以模拟均匀分布到近似高斯分布等各种分布。
得到一组样本数据后,通过调整eta分布的形状参数 可以对样本数据进行拟合,通常,可以利用最小二乘法计算形状参数 。