【概率统计通俗版】极大似然估计

文章目录

  • 相关教程
  • 相关文献
  • 例子1
  • 例子2
  • 定义
  • 0-1分布
  • 二项分布

作者:小猪快跑

基础数学&计算数学,从事优化领域7年+,主要研究方向:MIP求解器、整数规划、随机规划、智能优化算法

Maximum Likelihood Estimation(MLE),一般称之为极大似然估计 / 最大似然估计。利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值。

如有错误,欢迎指正。如有更好的算法,也欢迎交流!!!——@小猪快跑

相关教程

  • 常用分布的数学期望、方差、特征函数
  • 【推导过程】常用离散分布的数学期望、方差、特征函数
  • 【推导过程】常用连续分布的数学期望、方差、特征函数
  • Z分位数速查表
  • 【概率统计通俗版】极大似然估计
  • 【附代码&原理】正态分布检验
  • 【机器学习】【通俗版】EM算法(待更新)

相关文献

  • [1]茆诗松,周纪芗.概率论与数理统计 (第二版)[M].中国统计出版社,2000.
  • [2]周志华.机器学习 人工智能[M].清华大学出版社,2016.
  • [3]李航.统计学习方法[M].清华大学出版社,2012.
  • [4]谢文睿,秦州,贾彬彬.机器学习公式详解 第2版 人工智能[M].人民邮电出版社,2023.
  • [5] Do C B , Batzoglou S .What is the expectation maximization algorithm?[J].Nature Biotechnology, 2008, 26(8):897-9.DOI:10.1038/nbt1406.

例子1

箱子甲:99 个白球和 1 个黑球

箱子乙:99 个黑球和 1 个白球

随机选个箱子,并从中随机取 1 个球。结果取得白球,问这球是从哪一个箱子中取出?

白球黑球
991
199

直观感受来说,从箱子甲里面抽到白球的概率高。

不管是哪一个箱子,从箱子中任取一球都有两个可能的结果: A A A 表示取出白球, B B B 表示取出黑球。如果我们取出的是甲箱,则 A A A 发生的概率为 0.99,而如果取出的是乙箱,则 A A A 发生的概率为 0.01。现在一次试验中结果 A A A 发生了,人们的第一印象就是: “此白球 ( A ) (A) (A) 最像从甲箱取出的”,或者说,应该认为试验条件对结果 A A A 出现有利,从而可以推断这球是从甲箱中取出的。这个推断很符合人们的经验事实,这里 “最像” 就是 “最大似然” 之意。

例子2

从箱子里随机取出 5 个球,分别为 白、白、黑、白、黑,根据这个结果估计箱子白球和黑球的比例。

白球黑球概率
1 ✓ \checkmark p p p
2 ✓ \checkmark p p p
3 ✓ \checkmark 1 − p 1 - p 1p
4 ✓ \checkmark p p p
5 ✓ \checkmark 1 − p 1 - p 1p

设白球比例是 p p p,则黑球比例就是 1 − p 1 − p 1p,随机变量为 X X X

5 个球的概率分别是 p 、 p 、 1 − p 、 p 、 1 − p p 、p 、1 - p 、p 、1 - p pp1pp1p

这个结果发生的概率(似然函数): L ( p ) = p ⋅ p ⋅ ( 1 − p ) ⋅ p ⋅ ( 1 − p ) = p 3 ( 1 − p ) 2 L(p)=p\cdot p\cdot(1-p)\cdot p\cdot(1-p)=p^{3}(1-p)^{2} L(p)=pp(1p)p(1p)=p3(1p)2

极大似然估计的思想就是最大化发生的概率。于是我们只要求似然函数的最大值即可(求导=0)。

由于似然函数是乘积形式,不容易求导。因此先求对数(对数似然函数):
ln ⁡ L ( p ) = 3 ln ⁡ p + 2 ln ⁡ ( 1 − p ) \ln{L(p)}=3\ln p+2\ln(1-p) lnL(p)=3lnp+2ln(1p)
再求导=0:
∂ ln ⁡ L ( p ) ∂ p = 3 p − 2 1 − p = 0 \frac{\partial\ln L(p)}{\partial p} = \frac{3}{p} - \frac{2}{1-p} = 0 plnL(p)=p31p2=0
于是 p = 3 5 p = \frac{3}{5} p=53

注:这里对数似然函数是凹函数,凹函数的唯一驻点必是最大值。

定义

设总体的概率函数为 p ( x ; θ ) p(x;\theta) p(x;θ) θ ∈ Θ \theta\in\Theta θΘ,其中 θ \theta θ 是一个未知参数或几个未知参数组成的参数向量, Θ \Theta Θ 是参数空间, x 1 , ⋯ , x n x_1,\cdots,x_n x1,,xn 是来自该总体的样本,将样本的联合概率函数看成 θ \theta θ 的函数,用 L ( θ ; x 1 , ⋯ , x n ) L(\theta;x_1,\cdots,x_n) L(θ;x1,,xn) 表示,简记为 L ( θ ) L(\theta) L(θ)
L ( θ ) = L ( θ ; x 1 , ⋯ , x n ) = p ( x 1 ; θ ) ⋅ p ( x 2 ; θ ) ⋅ ⋯ ⋅ p ( x n ; θ ) L(\theta)=L(\theta;x_1,\cdots,x_n)=p(x_1;\theta)\cdot p(x_2;\theta)\cdot \cdots \cdot p(x_n;\theta) L(θ)=L(θ;x1,,xn)=p(x1;θ)p(x2;θ)p(xn;θ)
L ( θ ) L(\theta) L(θ) 称为样本的似然函数。如果某统计量 θ ^ = θ ^ ( x 1 , ⋯ , x n ) \hat{\theta}=\hat{\theta}(x_1,\cdots,x_n) θ^=θ^(x1,,xn) 满足
L ( θ ^ ) = max ⁡ θ ∈ Θ L ( θ ) L(\hat{\theta})=\max_{\theta\in\Theta}L(\theta) L(θ^)=θΘmaxL(θ)
则称 θ ^ \hat{\theta} θ^ θ \theta θ​ 的最大似然估计,简记为 MLE(Maximum Likelihood Estimate)

由于 ln ⁡ x \ln x lnx x x x 的单调增函数,因此,使对数似然函数 ln ⁡ L ( θ ) \ln L(\theta) lnL(θ) 达到最大与使 L ( θ ) L(\theta) L(θ) 达到最大是等价的。人们通常更习惯于由 ln ⁡ L ( θ ) \ln L(\theta) lnL(θ) 出发寻找 θ \theta θ 的最大似然估计。当 L ( θ ) L(\theta) L(θ) 是可微函数时,求导是求最大似然估计最常用的方法,此时对对数似然函数求导更加简单些。

0-1分布

0-1分布,也称为伯努利分布(Bernoulli distribution),是描述一次试验中只有两种可能结果的离散概率分布。这两个结果通常标记为成功(记为1)和失败(记为0)。如果成功的概率是 p p p 0 < p < 1 0 < p < 1 0<p<1),那么失败的概率就是 1 − p 1-p 1p

给定一组独立同分布的观测数据 X 1 , X 2 , . . . , X n X_1, X_2, ..., X_n X1,X2,...,Xn,每个 X i X_i Xi 都是从伯努利分布中抽取的样本,取值为0或1。我们要找的是参数 p p p 的最大似然估计 p ^ \hat{p} p^

似然函数 L ( p ) L(p) L(p) 是所有观测数据出现概率的乘积:

L ( p ) = ∏ i = 1 n p X i ( 1 − p ) 1 − X i L(p) = \prod_{i=1}^{n} p^{X_i} (1-p)^{1-X_i} L(p)=i=1npXi(1p)1Xi

为了简化计算,我们通常使用对数似然函数:

log ⁡ L ( p ) = ∑ i = 1 n [ X i log ⁡ p + ( 1 − X i ) log ⁡ ( 1 − p ) ] \log L(p) = \sum_{i=1}^{n} [X_i \log p + (1 - X_i) \log (1-p)] logL(p)=i=1n[Xilogp+(1Xi)log(1p)]

接下来,我们通过对 p p p 求导来找到使得对数似然函数最大的 p p p 值:

∂ log ⁡ L ( p ) ∂ p = ∑ i = 1 n ( X i p − 1 − X i 1 − p ) \frac{\partial \log L(p)}{\partial p} = \sum_{i=1}^{n} \left( \frac{X_i}{p} - \frac{1 - X_i}{1-p} \right) plogL(p)=i=1n(pXi1p1Xi)

令导数等于0以找到极大值点:

∑ i = 1 n ( X i p − 1 − X i 1 − p ) = 0 \sum_{i=1}^{n} \left( \frac{X_i}{p} - \frac{1 - X_i}{1-p} \right) = 0 i=1n(pXi1p1Xi)=0

整理后得到:

∑ i = 1 n X i p = n − ∑ i = 1 n X i 1 − p \frac{\sum_{i=1}^{n} X_i}{p} = \frac{n - \sum_{i=1}^{n} X_i}{1-p} pi=1nXi=1pni=1nXi

解这个方程可以得到 p p p 的最大似然估计 p ^ \hat{p} p^

p ^ = ∑ i = 1 n X i n \hat{p} = \frac{\sum_{i=1}^{n} X_i}{n} p^=ni=1nXi

这意味着参数 p p p 的最大似然估计 p ^ \hat{p} p^ 就是所有观测到的成功次数之和除以总的观测次数。换句话说, p ^ \hat{p} p^ 是样本中成功事件的比例。

二项分布

二项分布是一种离散概率分布,用于描述在n次独立的伯努利试验中成功次数的概率分布。假设每次试验成功的概率为p(0 < p < 1),那么在n次试验中恰好有k次成功的概率可以表示为:

P ( X = k ) = ( n k ) p k ( 1 − p ) n − k P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} P(X=k)=(kn)pk(1p)nk

其中, ( n k ) \binom{n}{k} (kn) 是组合数,表示从n个不同元素中选取k个元素的方式数。

对于二项分布来说,如果我们有一系列的观测数据 X 1 , X 2 , . . . , X m X_1, X_2, ..., X_m X1,X2,...,Xm,每个 X i X_i Xi都代表了n次试验中的成功次数,并且我们假设这些观测都是独立同分布的,那么似然函数L§可以写作:

L ( p ) = ∏ i = 1 m ( n X i ) p X i ( 1 − p ) n − X i L(p) = \prod_{i=1}^{m} \binom{n}{X_i} p^{X_i} (1-p)^{n-X_i} L(p)=i=1m(Xin)pXi(1p)nXi

因为组合数 ( n X i ) \binom{n}{X_i} (Xin)不依赖于参数p,所以在求最大似然估计时可以忽略它。因此对数似然函数简化为:

log ⁡ L ( p ) = ∑ i = 1 m [ X i log ⁡ p + ( n − X i ) log ⁡ ( 1 − p ) ] \log L(p) = \sum_{i=1}^{m} [X_i \log p + (n - X_i) \log (1-p)] logL(p)=i=1m[Xilogp+(nXi)log(1p)]

为了找到使这个对数似然函数最大化的p值,我们需要对p求导并令其等于零:

∂ log ⁡ L ( p ) ∂ p = ∑ i = 1 m ( X i p − n − X i 1 − p ) = 0 \frac{\partial \log L(p)}{\partial p} = \sum_{i=1}^{m} \left( \frac{X_i}{p} - \frac{n - X_i}{1-p} \right) = 0 plogL(p)=i=1m(pXi1pnXi)=0

解这个方程,我们可以得到p的最大似然估计 p ^ \hat{p} p^

p ^ = ∑ i = 1 m X i m n \hat{p} = \frac{\sum_{i=1}^{m} X_i}{mn} p^=mni=1mXi

这意味着,如果进行了m组每组n次的试验,总共的成功次数除以总的试验次数,就得到了成功概率p的最大似然估计。简单地说,就是所有观测到的成功次数总和除以总的试验次数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/474850.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

完整http服务器

目录 背景目标描述技术特点开发环境WWW客户端浏览发展史服务端http发展史http分层概览 背景 http协议被广泛使用&#xff0c;从移动端&#xff0c;pc浏览器&#xff0c;http无疑是打开互联网应用窗口的重要协议&#xff0c;http在网络应用层中的地位不可撼动&#xff0c;是能…

详细描述一下Elasticsearch搜索的过程?

大家好&#xff0c;我是锋哥。今天分享关于【详细描述一下Elasticsearch搜索的过程&#xff1f;】面试题。希望对大家有帮助&#xff1b; 详细描述一下Elasticsearch搜索的过程&#xff1f; Elasticsearch 的搜索过程是其核心功能之一&#xff0c;允许用户对存储在 Elasticsea…

springBoot插件打包部署

打包插件spring-boot-maven-plugin 不使用插件&#xff0c;运行时&#xff0c;异常信息为“没有主清单属性” 本地部署 杀进程

[ 网络安全介绍 1 ] 什么是网络安全?

&#x1f36c; 博主介绍 &#x1f468;‍&#x1f393; 博主介绍&#xff1a;大家好&#xff0c;我是 _PowerShell &#xff0c;很高兴认识大家~ ✨主攻领域&#xff1a;【渗透领域】【数据通信】 【通讯安全】 【web安全】【面试分析】 &#x1f389;点赞➕评论➕收藏 养成习…

无插件H5播放器EasyPlayer.js视频流媒体播放器如何开启electron硬解码Hevc(H265)

在数字化时代&#xff0c;流媒体播放器技术正经历着前所未有的变革。随着人工智能、大数据、云计算等技术的融合&#xff0c;流媒体播放器的核心技术不断演进&#xff0c;为用户提供了更加丰富和个性化的观看体验。 EasyPlayer.js H5播放器&#xff0c;是一款能够同时支持HTTP、…

阿里数字人工作 Emote Portrait Alive (EMO):基于 Diffusion 直接生成视频的数字人方案

TL;DR 2024 年 ECCV 阿里智能计算研究所的数字人工作&#xff0c;基于 diffusion 方法来直接的从音频到视频合成数字人&#xff0c;避免了中间的三维模型或面部 landmark 的需求&#xff0c;效果很好。 Paper name EMO: Emote Portrait Alive - Generating Expressive Portra…

Unity脚本基础规则

Unity脚本基础规则 如何在Unity中创建一个脚本文件&#xff1f; 在Project窗口中的Assets目录下&#xff0c;选择合适的文件夹&#xff0c;右键&#xff0c;选择第一个Create&#xff0c;在新出现的一栏中选择C# Script&#xff0c;此时文件夹内会出现C#脚本图标&#xff0c;…

基于YOLOv8深度学习的无人机航拍小目标检测系统(PyQt5界面+数据集+训练代码)

本研究提出并实现了一种基于YOLOv8深度学习模型的无人机航拍小目标检测系统&#xff0c;旨在解决高空环境下汽车目标检测的技术难题。随着无人机技术的发展&#xff0c;航拍图像已广泛应用于交通监控、城市管理、灾害应急等多个领域。然而&#xff0c;由于无人机通常在较高的飞…

Excel如何把两列数据合并成一列,4种方法

Excel如何把两列数据合并成一列,4种方法 参考链接:https://baijiahao.baidu.com/s?id=1786337572531105925&wfr=spider&for=pc 在Excel中,有时候需要把两列或者多列数据合并到一列中,下面介绍4种常见方法,并且提示一些使用注意事项,总有一种方法符合你的要求:…

VSCode自定义插件创建教程

文章目录 一、前言二、插件维护三、调试插件四、使用 vsce 生成 vsix 插件五、问题&#xff1a;打开调试窗口后&#xff0c;输入helloworld并没有指令提示六、插件创建实战七、拓展阅读 一、前言 对于前端程序猿来讲&#xff0c;最常用的开发利器中VSCode首当其冲&#xff0c;…

HarmonyOS Next 关于页面渲染的性能优化方案

HarmonyOS Next 关于页面渲染的性能优化方案 HarmonyOS Next 应用开发中&#xff0c;用户的使用体验至关重要。其中用户启动APP到呈现页面主要包含三个步骤&#xff1a; 框架初始化页面加载布局渲染 从页面加载到布局渲染中&#xff0c;主要包含了6个环节&#xff1a; 执行页…

深度学习之目标检测的技巧汇总

1 Data Augmentation 介绍一篇发表在Big Data上的数据增强相关的文献综述。 Introduction 数据增强与过拟合 验证是否过拟合的方法&#xff1a;画出loss曲线&#xff0c;如果训练集loss持续减小但是验证集loss增大&#xff0c;就说明是过拟合了。 数据增强目的 通过数据增强…

记录下,用油猴Tampermonkey监听所有请求,绕过seesion

油猴Tampermonkey监听所有请求&#xff0c;绕过seesion 前因后果脚本编写 前因后果 原因是要白嫖一个网站的接口&#xff0c;这个接口的页面入口被隐藏掉了&#xff0c;不能通过页面调用&#xff0c;幸好之前有想过逆向破解通过账号密码模拟登录后拿到token&#xff0c;请求该…

百度遭初创企业指控抄袭,维权还是碰瓷?

“ 抄袭指控引发网友热议&#xff0c;有人支持其立场&#xff0c;也有人认为工具类产品在界面设计上相似度高是行业常态。 ” 转载|科技新知 原创 作者丨晓伊 编辑丨蕨影 一年一度的百度世界大会刚刚落幕&#xff0c;一家初创企业却站出来公开指责百度抄袭自家产品&#xff…

golang通用后台管理系统09(系统操作日志记录)

1.日志工具类 package log/**** 日志记录 wangwei 2024-11-18 15:30*/ import ("log""os""path/filepath""time" )// 获取以当前日期命名的日志文件路径 func getLogFilePath() string {currentDate : time.Now().Format("2006-…

迁移学习理论与应用

迁移学习&#xff08;Transfer Learning&#xff09;是一种机器学习技术&#xff0c;旨在将一个任务&#xff08;源任务&#xff09;上学到的知识迁移到另一个相关但不完全相同的任务&#xff08;目标任务&#xff09;上&#xff0c;从而提高目标任务的学习效果。这种方法的核心…

Azure Kubernetes Service (AKS)资源优化策略

针对Azure Kubernetes Service (AKS)的资源优化策略&#xff0c;可以从多个维度进行考虑和实施&#xff0c;以提升集群的性能、效率和资源利用率。以下是一些关键的优化策略&#xff1a; 一、 Pod资源请求和限制 设置Pod请求和限制&#xff1a;在YAML清单中为所有Pod设置CPU和…

Vue3 虚拟列表组件库 virtual-list-vue3 的使用

Vue3 虚拟列表组件库 virtual-list-vue3 的基本使用 分享个人写的一个基于 Vue3 的虚拟列表组件库&#xff0c;欢迎各位来进行使用与给予一些更好的建议&#x1f60a; 概述&#xff1a;该组件组件库用于提供虚拟化列表能力的组件&#xff0c;用于解决展示大量数据渲染时首屏渲…

qt之QFTP对文件夹(含嵌套文件夹和文件)、文件删除下载功能

一、前言 主要功能如下&#xff1a; 1.实现文件夹的下载和删除&#xff0c;网上很多资料都是单独对某个路径的文件操作的&#xff0c;并不能对文件夹操作 2.实现目标机中含中文名称自动转码&#xff0c;有些系统编码方式不同&#xff0c;下载出来的文件会乱码 3.实现ftp功能…

SpringBoot登录功能实现思路(验证码+拦截器+jwt)

总括 用户输入用户名和密码和验证码即可进行登录 验证码 VerifyCode&#xff1a;生成验证码的工具类 /*** 生成验证码的工具类*/ public class VerifyCode {private int w 70;//设置缓冲区的宽private int h 35;//设置缓冲区的宽private Random r new Random();//从字体…