离散数学---概率, 期望

本文根据 MIT 计算机科学离散数学课程整理(Lecture 22 ~ Lecture 24)。

1 非负整数期望性质

用 N 表示非负整数集合,R 是 N 上的随机变量,则 R 的期望可以表示成:E(R)=\sum_{i=0}^{\infty} P(R>i)=\sum_{i=1}^{\infty} P(R \ge i)

证明:

E(R)=\sum_{i=0}^{n\to \infty} i \cdot P(R=i) =\\ P(R=1) + \\ P(R=2) + P(R=2) + \\ P(R=3) + P(R=3) + P(R=3) + \\ \\ ...\\ \\ P(R=n) + ... + P(R=n)\\

换一个形式,把每一列写到一起,既 E(R)=\sum_{i=1}^{\infty} \sum_{j=i}^{\infty} P(R=j)=\sum_{i=1}^{\infty} P(R \ge i)

 同时期望也可以写成 E(R)=\sum_{i=0}^{\infty} \sum_{j=i+1}^{\infty} P(R=j)=\sum_{i=0}^{\infty} P(R > i)

应用:

对于一个系统,每一个单位时间都有 p 的概率损坏,求系统发生损坏的期望时间。

随机变量为单位时间,满足非负整数,故 E(T)=\sum_{i=0}^{\infty} i \cdot P(T=i) = \sum_{i=1}^{\infty} P(T \ge i)=\sum_{i=1}^{\infty} (1-p)^i=\frac{1}{p}-1

 2 期望的线性性质

对于随机变量 x_1,x_2,...,x_n 满足 E(x_1+x_2+...+x_n)=E(x_1)+E(x_2)+...+E(x_n)

对于常数 a, b 有 E(a\cdot R+b)=a\cdot E(R)+b 

证明:

只需证明对于随机变量 X 和 Y,满足 E(X+Y)=E(X)+E(Y)

E(X+Y)=\sum_{x\in X} \sum_{y\in Y} (x+y)\cdot P(X=x,Y=y) \\ = \sum_{x\in X} \sum_{y\in Y} x\cdot P(X=x,Y=y) + \sum_{y\in Y} \sum_{x\in X} y\cdot P(X=x,Y=y) \\ = \sum_{x\in X} x \sum_{y\in Y} P(X=x,Y=y) + \sum_{y\in Y} y \sum_{x\in X} P(X=x,Y=y) \\ = \sum_{x\in X} x \cdot P(X=x) + \sum_{y\in Y} y \cdot P(Y=y) =E(X)+E(Y)

应用:

帽子检查问题(Hat-Check Problem):标号为 1~n 的球放置在对应标号为 1~n 的位置,把所有的球重新排列,R 表示球在原来正确对应编号位置的个数,求 R 的期望。

T_i 表示第 i 个球是否在正确的位置,可以求得分布为:

T_i = \left\{\begin{matrix} 1,p=\frac{1}{n} \\ 0,p=1-\frac{1}{n} \end{matrix}\right.

则有:E(T_i)=\frac{1}{n},根据期望线性性质有:E(R)=E(T_1+T_2+...+T_n)= \sum_{i=1}^{n}E(T_i)=1

实际上可以求得R 的概率分布为:

P(R=k)=\left\{\begin{matrix} \frac{1}{k!(n-k)} \quad k \le n-2 \\ \frac{1}{n!} \quad k=n-1,n \end{matrix}\right.

对于  k\le n-2

P(R=k)= \binom{n}{k} \cdot \frac{1}{n} \cdot \frac{1}{n-1} \cdot ... \cdot \frac{1}{n-k+1} \cdot \frac{n-k-1}{n-k} \cdot ... \cdot \frac{1}{2} \cdot 1 \\ =\frac{n!}{k! \cdot (n-k)!} \cdot \frac{(n-k-1)!}{n!} \\ =\frac{1}{k!(n-k)}

3 事件发生的期望次数

给定概率空间为 S,事件 A_1,A_2,...,A_n \subseteq S,用随机变量 T 表示事件发生的个数,则有:

1. 这些事件发生个数的期望值为事件发生概率相加,即: E(T)=\sum_{i=1}^{n} P(A_i)

2. P(T=0) \le e^{-E(T)} 

证明: 

定义:T_i(w)=\left\{\begin{matrix} 1 \quad w \in A_i \\ 0 \quad w \notin A_i \end{matrix}\right.

则有:E(T)=\sum_{i=1}^{n} E(T_i)=\sum_{i=1}^{n} P(T_i=1)=\sum_{i=1}^{n} P(A_i)

 P(T=0) =\prod_{i=1}^{n}(1-P(A_i)) \\ \le \prod_{i=1}^{n} e^{-P(A_i)} \\ = e^{-\sum_{i=1}^{n}P(A_i) }\\ =e^{-E(T)}

应用:

抛 n 个硬币,求硬币朝上的个数期望。

用 A_i 表示事件为第 i 个硬币朝上,期望可以表示成事件概率之和:E=\sum_{i=1}^{n} P(A_i)=\frac{n}{2}

实际上不使用该性质,期望可以直接表示成:E=\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n},经过化简得到结果也是 \frac{n}{2}

 E=\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n}=\sum_{i=1}^{n} i \cdot \binom{n}{n-i} \cdot 2^{-n}=\sum_{i=1}^{n} (n-i) \cdot \binom{n}{i} \cdot 2^{-n}=n \cdot 2^{-n}\sum_{i=1}^{n} \binom{n}{i}-\sum_{i=1}^{n} i \cdot \binom{n}{i} \cdot 2^{-n}=n\cdot 2^{-n}\cdot 2^{n}-E=n-E

所以:2E=n \to E=\frac{n}{2} 

 4 期望乘法规则

如果随机变量 R_1,R_2,...,R_n 相互独立,则有 E(R_1 \cdot R_2\cdot ...\cdot R_n)=E(R_1)\cdot E(R_2)\cdot ...\cdot E(R_n)

证明:

只需证明对于两个相互独立的随机变量 X 和 Y,有 E(X\cdot Y) = E(X) \cdot E(Y) 成立。

由独立的概率性质可知:P(X = x, Y = y) = P(X = x) \cdot P(Y = y)

则有:

E(X\cdot Y) = \sum_{x} \sum_{y} x\cdot y \cdot P(X = x, Y = y) \\ = \sum_{x} \sum_{y} xy \cdot P(X = x) \cdot P(Y = y) \\ =\left( \sum_{x} x \cdot P(X = x) \right) \cdot \left( \sum_{y} y \cdot P(Y = y) \right)\\ =E(X)\cdot E(Y)

 5 马尔可夫不等式 (Markov's Thm.)

 对于非负随机变量 R,\forall x > 0, P(R \ge x) \le \frac{E(R)}{x}

证明 

E(R)=E(R|R\ge x)\cdot P(R\ge x)+E(R|R<x)\cdot P(R<x)

大于等于 x 的部分,显然期望也大于等于 x,即 E(R|R\ge x) \ge x 

由非负的前提, E(R|R<x) \ge 0E(R|R<x)\cdot P(R<x) \ge 0

E(R)\ge x\cdot P(R\ge x),即 P(R \ge x) \le \frac{E(R)}{x}

推论

令 x=c\cdot E(R), c >0,得到推论:P(R\ge c\cdot E(R))\le \frac{1}{c}

6 切比雪夫不等式 (Chebyshev's Thm.)

对任意随机变量 R,\forall x>0 ,P(\left | R-E(R) \right | \ge x ) \le \frac{Var(R)}{x^2},其中 Var(R) 表示 R 的方差。

证明

P(\left | R-E(R) \right | \ge x ) = P( (R-E(R))^2 \ge x^2),令 T=(R-E(R))^2 \ge0,满足马尔可夫使用条件, 则有 P(T \ge x^2) \ge \frac{E(T)}{x^2}=\frac{Var(R)}{x^2}

 推论

记 \sigma (R) 为 R 的标准差,且满足 \sigma(R) > 0,令 x=c\cdot \sigma(R),c>0,得到推论 P(|R-E(R)|\ge c\cdot \sigma(R)) \le \frac{1}{c^2}

对于 \sigma(R) =0 的特殊情况,P(|R-E(R)|\ge 0) =1,推论表达式并不成立。然而原表达式为 P(0\ge x) =0 \le 0 ,是成立的。

7 一侧切比雪夫不等式 (Cantelli's inequality)

对任意随机变量 R,\forall x>0,有

P( R-E(R) \ge x ) \le \frac{Var(R)}{x^2+Var(R)} \\ P( R-E(R) \le -x ) \le \frac{Var(R)}{x^2+Var(R)}

证明

下面证明 P( R-E(R) \ge x ) \le \frac{Var(R)}{x^2+Var(R)},反向同理。

令 T=R-E(R),即证明:P(T \ge x ) \le \frac{Var(R)}{x^2+Var(R)}

若 T<0,则 P( R-E(R) \ge x )=0,显然成立。下面考虑T \ge0 的情况。 

下面证明:\forall x>0,y>0,P(T+y\ge x+y)\le\frac{Var(R)+y^2}{(x+y)^2}

令 Z=T+y

P(T+y\ge x+y)=\sum_{z\ge x+y}P(Z=z)\le \sum_{z\ge x+y}\frac{z^2}{(x+y)^2}\cdot P(Z=z)\le \frac{1}{(x+y)^2}\cdot \sum_{z\in Z}z^2\cdot P(Z=z)\\ =\frac{E(Z^2)}{(x+y)^2}= \frac{E(T^2)+y^2+2\cdot y\cdot E(T)}{(x+y)^2}=\frac{Var(R)+y^2}{(x+y)^2}

 令 f(y)=\frac{Var(R)+y^2}{(x+y)^2},y>0

问题转化为证明:f(y)\le \frac{Var(R)}{x^2+Var(R)}

 f^{'}(y)=\frac{2\cdot x\cdot y-2\cdot Var(R)}{(x+y)^3},求得极小值点为:y_{min}=\frac{Var(R)}{x},代入得到 f(y_{min})=\frac{x^2\cdot Var(R)+Var^2(R)}{x^4+Var^2(R)+2\cdot x^2\cdot Var(R)} = \frac{Var(R)\cdot (x^2+Var(R))}{(x^2+Var(R))^2} = \frac{Var(R)}{x^2+Var(R)}

f(y)\le f(y_{min})=\frac{Var(R)}{x^2+Var(R)}

8 切诺夫界 (Chernoff bound)

T_1,T_2,...,T_n 之间相互独立,T_i 服从伯努利分布 (T_i \in \{0,1\}),记 T=\sum_i^nT_i\forall c >1,记 z=c\cdot ln(c)+1-c,则有 P(T\ge c\cdot E(T)) \le e^{-z\cdot E(T)}

证明

P(T\ge c\cdot E(T))=P(c^T\ge c^{c\cdot E(T)})

其中 c^T \ge 0,满足马可夫不等式条件,则有:P(c^T\ge c^{c\cdot E(T)})\le \frac{E(c^T)}{c^{c\cdot E(T)}}

E(c^T)=E(\prod_{i=1}^{n}c^{T_i} )=\prod_{i=1}^{n}E(c^{T_i})

E(c^{T_i})=c^1\cdot P(T_i=1)+c^0\cdot P(T_i=0)

注意到 P(T_i=0)=1-P(T_i=1)E(T_i)=P(T_i=1)

得到: E(c^{T_i})=1+(c-1)\cdot E(T_i)

由不等式:x+1\le e^x,得到:E(c^{T_i}) \le e^{(c-1)\cdot E(T_i)}

E(c^T)=\prod_{i=1}^{n}E(c^{T_i})\le e^{(c-1)\cdot \sum_{i=1}^n E(T_i)}=e^{(c-1)\cdot E(T)}

\frac{E(c^T)}{c^{c\cdot E(T)}}\le \frac{e^{(c-1)\cdot E(T)}}{c^{c\cdot E(T)}} = e^{-(c\cdot ln(c)+1-c)\cdot E(T)}=e^{-z\cdot E(T)}

拓展

T_1,T_2,...,T_n 之间相互独立,T_i  满足 0 \le T_i \le 1,上式仍然成立。

9 案例应用一

加州大学伯克利分校某计科教授论文中,对于 RISC 和 Z8002 两种指令集架构做出了如下统计:

对最后一项比值求和取均值得到 1.2 ,于是给出结论为: Z8002 的平均代码量比 RISC 长 20%。

然而如果把统计量改为 \frac{RISC}{Z8002} ,区平均值求得 1.105,按照该逻辑结论应为: RISC 的平均代码量比 Z8002 长 10.5%。

问题在于,对于统计量 Z 和 R,如果 E(\frac{Z}{R})=k ,并不能推出 \frac{E(Z)}{E(R)} = k,即 E(\frac{Z}{R})=k \nvdash \frac{E(Z)}{E(R)} = k

论文中求得 E(\frac{\text{Z8002}}{\text{RISC}})=1.2 ,并不能说明 \frac{E(\text{Z8002})}{E(\text{RISC})}=1.2

10 案例应用二

如果有 n 个作业,表示为 b_1,b_2,..,b_n,m 个网络服务器,表示为 s_1,s_2,..,s_m。服务器需要处理作业请求,b_i 需要服务器处理时间为 l_i(0\le l_i \le1),记 l=\sum_{i=1}^n l_i。采用什么方法把任务分配给服务器,使得每个服务器处理的期望时间为 \frac{l}{m} 。

采用将 n 个作业随机分配给 m 个服务器的方法,可以达到期望时间。

用 R_{i,j} 表示作业 b_j 被分配给服务器 s_i 处理,由于是随机分配,可以得到分布:

R_{i,j}=\left\{\begin{matrix} l_j \quad , p=\frac{1}{m} \\ 0 \quad , p=1-\frac{1}{m} \end{matrix}\right.

E(R_{i,j})=\frac{l_j}{m}

第 i 个服务器的总期望负载期望表示为:  \sum_{j=1}^nE(R_{i,j})

而且有: \sum_{j=1}^nE(R_{i,j})=\sum_{j=1}^n\frac{l_j}{m}=\frac{l}{m}

可以证明,发生服务器负载比期望大很多的概率很小。用 R_i 表示第 i 个服务器的实际负载,则有:

P(\max_{i=1}^m R_i \ge c \cdot \frac{l}{m} )\\ =P(\bigcup_{i=1}^{m} R_i \ge c \cdot \frac{l}{m}) \\ \le \sum_{i=1}^m P(R_i\ge c \cdot \frac{l}{m})

  R_i=\sum_{j=1}^nE(R_{i,j}) ,而且有 0 \le R_{i,j} \le 1,根据切洛夫界拓展,可知:

\sum_{i=1}^m P(R_i\ge c \cdot \frac{l}{m}) \le m\cdot e^{-z\cdot \frac{l}{m} }

 假设取 c=1.1,z\approx 0.0048e^{-z\cdot \frac{l}{m} } \approx e^{-0.0048} \le \frac{1}{160000}

 如果使用 1000 台服务器,粗略估计最坏服务器超过负载均衡 10% 的概率也是很小的值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/476027.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AI一键生成原创花卉印花图案——创新与效率的结合

引言 在时尚界&#xff0c;印花图案一直是设计师们表达创意和个性的重要手段。随着人工智能技术的发展&#xff0c;AI在设计领域的应用越来越广泛&#xff0c;其中就包括了一键生成原创花卉印花图案。本文将探讨AI如何帮助设计师们提高效率&#xff0c;同时保持设计的创新性和…

QT实操中遇到的一些(C++)疑惑点汇总

QT实操中 遇到的一些C疑惑点汇总 1.实例化对象的两种方法及其访问方式 1.1 示例 1.2 总结 2.基类成员的访问 2.1 直接访问继承的基类成员 2.1.1示例代码 2.1.2 输出结果 2.2 使用作用域解析符来显式调用基类成员函数 2.2.1 示例代码 2.2.2 输出结果 2.3 使用 this 指针访问基类…

图形学笔记 - 4. 几何 -网格操作和阴影映射

文章目录 网格操作&#xff1a;几何处理细分Loop细分Catmull-Clark细分&#xff08;一般网格&#xff09;网格简化 阴影 Shadows可视化阴影映射阴影映射阴影贴图的问题 网格操作&#xff1a;几何处理 网格细分网格简化网格正则化 网格细分&#xff08;上采样&#xff09; 网…

OBOO鸥柏车载广告屏:28.6寸液晶一体机的技术革新与应用前景

在数字化迅速发展的今天&#xff0c;OBOO鸥柏推出的28.6寸车载长条形液晶广告屏一体机成为了市场的一大亮点。这款产品不仅具有超窄边框的高亮设计&#xff0c;还利用异形激光切割技术&#xff0c;支持多种形状如圆形、方形及三角形展示&#xff0c;极大地提升了商用和工业屏幕…

Spring Cloud Alibaba、Spring Cloud 与 Spring Boot各版本的对应关系

参考spring-cloud-alibaba github wiki说明&#xff1a;版本说明 下面截取说明&#xff1a; 2022.x 分支 2021.x 分支 2.2.x 分支 组件版本关系

Springboot + vue 健身房管理系统项目部署

1、前言 ​ 许多人在拿到 Spring Boot 项目的源码后&#xff0c;不知道如何运行。我以 Spring Boot Vue 健身房管理系统的部署为例&#xff0c;详细介绍一下部署流程。大多数 Spring Boot 项目都可以通过这种方式部署&#xff0c;希望能帮助到大家。 ​ 2、项目查看 ​ 首…

SOL链上的 Meme 生态发展:从文化到创新的融合#dapp开发#

一、引言 随着区块链技术的不断发展&#xff0c;Meme 文化在去中心化领域逐渐崭露头角。从 Dogecoin 到 Shiba Inu&#xff0c;再到更多细分的 Meme 项目&#xff0c;这类基于网络文化的加密货币因其幽默和社区驱动力吸引了广泛关注。作为近年来备受瞩目的区块链平台之一&…

基于大数据爬虫数据挖掘技术+Python的网络用户购物行为分析与可视化平台(源码+论文+PPT+部署文档教程等)

#1024程序员节&#xff5c;征文# 博主介绍&#xff1a;CSDN毕设辅导第一人、全网粉丝50W,csdn特邀作者、博客专家、腾讯云社区合作讲师、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老…

主机管理工具 WGCLOUD v3.5.6 更新了哪些特性

WGCLOUD-v3.5.6 更新说明&#xff0c;2024-11-20发布 1. 新增&#xff0c;个性化采集&#xff0c;查看 2. 新增&#xff0c;支持达梦数据库做数据源来存贮监控数据&#xff0c;查看说明(8) 3. 新增&#xff0c;日志监控支持配置自动处理指令&#xff0c;当发现日志出现告警关键…

设计模式之 享元模式

享元模式&#xff08;Flyweight Pattern&#xff09;是一种结构型设计模式&#xff0c;用于减少系统中对象的数量&#xff0c;从而节省内存和提升性能。它通过共享相同的对象来避免重复创建类似的对象。该模式尤其适用于对象数量庞大、且重复内容较多的场景。 核心思想&#x…

yolov5 数据集分享:纯干货

数据集分享&#xff1a;纯干货 1. 遇见数据集&#xff1a;这是一个国内的数据集搜索引擎&#xff0c;索引了国内外的大部分网站&#xff0c;提供最新的数据集推荐。[遇见数据集网站](https://www.selectdataset.com/) 2. Kaggle&#xff1a;一个领先的数据科学和机器学习爱好者…

如何实现3D模型在线展示、互动和分享?

实现3D模型在线展示、互动和分享&#xff0c;可以通过多种途径和技术手段来完成。以下是一些具体的方法和步骤&#xff1a; 一、选择适合的3D模型展示平台 首先&#xff0c;你需要选择一个支持3D模型在线展示、互动和分享的平台。这些平台通常提供用户友好的界面和工具&#x…

大数据-227 离线数仓 - Flume 自定义拦截器(续接上节) 采集启动日志和事件日志

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; Java篇开始了&#xff01; 目前开始更新 MyBatis&#xff0c;一起深入浅出&#xff01; 目前已经更新到了&#xff1a; Hadoop&#xff0…

CANoe录制和回放CAN报文

目录 1、录制报文 2、离线回放 3、在线回放 3.1、在线回放设置 CANoe是一款用于汽车电子测试的工具&#xff0c;它可以模拟CAN网络中的各种设备&#xff0c;并支持CAN报文的录制和回放功能&#xff0c;方便我们远程调试。 1、录制报文 在Measurement Setupk面板点击Loggi…

大数据调度组件之Apache DolphinScheduler

Apache DolphinScheduler 是一个分布式易扩展的可视化 DAG 工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系&#xff0c;使调度系统在数据处理流程中开箱即用。 主要特性 易于部署&#xff0c;提供四种部署方式&#xff0c;包括Standalone、Cluster、Docker和…

XCode Build时遇到 .entitlements could not be opened 的问题

遇到错误 在构建成功的XCode工程上&#xff0c;手动打开XCode并Build&#xff0c;遇到以下问题&#xff1a; The file .entitlements could not be opened. Did you forget to declare this file as an output of a script phase or custom build rule which produces it 打…

关于一次开源java spring快速开发平台项目RuoYi部署的记录

关于一次开源java spring快速开发平台项目RuoYi部署的记录 本次因为需要一些练习环境&#xff0c;想要快速搭建一个javaweb 项目作为练习环境&#xff0c;经过查询和实验找到一个文档详细&#xff0c;搭建简单&#xff0c;架构也相对比较新的开源项目RuoYi。 项目介绍&#xf…

原生微信小程序在顶部胶囊左侧水平设置自定义导航兼容各种手机模型

无论是在什么手机机型下&#xff0c;自定义的导航都和右侧的胶囊水平一条线上。如图下 以上图iphone12&#xff0c;13PRo 以上图是没有带黑色扇帘的机型 以下是调试器看的wxml的代码展示 注意&#xff1a;红色阔里的是自定义导航&#xff08;或者其他的logo啊&#xff0c;返回之…

列出D3的所有交互方法,并给出示例

D3.js 提供了丰富的交互方法&#xff0c;可以用来增强图表的用户交互体验。以下是一些常用的交互方法及其示例&#xff1a; 1. 鼠标事件 on("mouseover", function) 用途: 当鼠标悬停在元素上时触发。示例:svg.selectAll(".bar").on("mouseover&qu…

小程序-使用 iconfont 图标库报错:Failed to load font

官方默认可以忽略此错误&#xff0c;在清除缓存后首次刷新会显示此错误&#xff0c;重新渲染错误消失 解决方法&#xff1a; 在 iconfont 图标库选择项目设置 选中 Base64 保存&#xff0c;重新点击链接 -> 复制代码到项目中 操作步骤&#xff1a;