Skip to content

Lecture 22:期望

来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024


1. 期望的定义

定义(期望值 / 均值): 随机变量 R期望expected value,或均值)定义为: $$\mathbb{E}[R] := \sum_{\omega \in S} R(\omega) \cdot \Pr[\omega]$$

注意: 期望值不一定是 R 可取到的值(例如掷一枚骰子的期望是 3.5)。

示例一(骰子): S=1,2,3,4,5,6R(ω)=ω

E[R]=116+216++616=72

示例二(指示随机变量): 事件 A 的指示随机变量 IA 的期望等于事件概率:

E[IA]=Pr[A]

2. 等价计算公式

定理一(按值域求和):

E[R]=xrange(R)xPr[R=x]

当结果数量远多于 R 的取值数时,此公式更高效。

定理二(自然数值域时的尾和公式):range(R)N,则:

E[R]=i=0iPr[R=i]=i=0Pr[R>i]

证明思路: Pr[R=i] 在后一个求和中被计数 i 次,恰好对应期望的定义。


3. 期望无穷大的情形

Pr[时延=i]=1/ii=1,2,),则期望时延为 i=11/i,发散至无穷。

此时,样本均值(有限次观测的平均值)始终有限,但无法逼近真实期望,需特别注意。


4. 期望的线性性(Linearity of Expectation

定理(线性性): 对任意随机变量 R1R2: $$\mathbb{E}[R_1 + R_2] = \mathbb{E}[R_1] + \mathbb{E}[R_2]$$ 无需独立性假设!

与概率对比: Pr[AB]=Pr[A]Pr[B] 仅在独立时成立;Pr[AB]=Pr[A]+Pr[B] 仅在互斥时成立。但期望的线性性对任意随机变量均成立。

示例(两枚骰子之和): R=R1+R2Ri 为第 i 枚骰子):

E[R]=E[R1]+E[R2]=72+72=7

即使两枚骰子完全相关(永远一样),此计算也成立!

四个易混淆公式总结:

公式说明
E[R]=ωSR(ω)Pr[ω]定义,对结果求和
E[R]=xxPr[R=x]等价形式,对 RV 值求和
E[R]=i=0Pr[R>i]仅当 range(R)N 时有效
E[R1+R2]=E[R1]+E[R2]线性性,对多个 RV 求和

5. 平均故障时间(Mean Time to Failure

问题: 零件各自以概率 p 有缺陷,直到第一个有缺陷零件为止共生产了多少个零件(含该零件)?

R 为该数量,利用尾和公式:

E[R]=i=0Pr[R>i]=i=0(1p)i=11(1p)=1p

6. 手机取回问题(Cellphone Check Problem

问题: n 人把手机放入袋中,随机取回一部,期望有多少人取回自己的手机?

直接法困难: 需计算 Pr[R=k],表达式很复杂。

用线性性求解:Ii 为"第 i 人取回自己手机"的指示随机变量,则 R=i=1nIi

E[R]=i=1nE[Ii]=i=1nPr[Ii=1]=n1n=1

转盘版本: n 人的手机在转盘上旋转,要么全取回(概率 1/n),要么全没取回(概率 11/n):

E[R]=n1n+0(11n)=1

两个版本中各 Ii 的独立性截然不同,但线性性使计算同样简单。

参考(复杂直接公式):

Pr[R=k]=1k!i=0nk(1)ii!

线性性大大简化了计算,且适用于变量间存在任意相关性的情形。


7. 彩票游戏(How to Win the Lottery

规则: 三人各下注 2 颗糖,猜正反面,根据猜对人数分配奖池。

  • 公平游戏时:E[P]=0P 为某人净收益)
  • 若另两人串通(总选相反):E[P]=1/2

直觉: 串通使某人永远无法独赢 4 颗糖,导致期望收益下降。

伟大的期望

一个随机变量的期望值(或称为期望)是一个能够揭示该变量行为特征的单一数值。期望值也被称为均值平均值。更准确地说,一个随机变量的期望值是它的所有可能取值的加权平均值,其中每个取值的权重是它出现的概率。正式地讲,随机变量的期望值定义如下:

Ex[R]::=wSR(w)Pr[w]

还有另外一种标准方法定义期望。

IMPORTANT

Thm 17.5.1

对于任何随机变量R,Ex[R]=xrange(R)x·Pr[R=x]​​。

其中range(R)表示R的取值范围,或者是值域

直觉上, 期望值就是长期平均结果。如果你反复多次试验,比如扔骰子、抽签,每次结果是某个值 x,出现的概率是 Pr[R=x],那么在大量重复试验后,平均结果就会趋近于这个加权平均值。

image-20250530214238661

期望的线性性质

IMPORTANT

Thm 17.5.1

对于任何随机变量R1R2,都有Ex[R1+R2]=Ex[R1]+Ex[R2]

image-20250530212709650

IMPORTANT

Thm 17.5.2

对于任何随机变量R1R2,都有Ex[a1R1+a2R2]=a1Ex[R1]+a2Ex[R2]

它不要求独立性,适用于各种复杂问题。

NOTE

定义指示随机变量 Ri,表示事件 Ai 是否发生:

  • 如果试验结果 ω 落在事件 Ai 里,那么 Ri(ω)=1
  • 否则 Ri(ω)=0​。

IMPORTANT

给定一组事件 A1,A2,,An,则它们中发生的事件数的期望为 E[number of events that occur]=i=1nPr[Ai]

也就是说:你有一堆事件(可能有关也可能无关),我们关心的是“有多少个事件会发生”这个数量的期望(期望值),或者说当你要计算一组事件中“平均会有多少发生”时,这个期望值就是每个事件发生的概率之和。举个例子,如果投掷两次筛子,两次投掷的结果总和的期望 = 3.5 + 3.5 = 7

二项分布的线性期望

虽然看起来你需要计算一个复杂的求和,但其实可以用非常直观且强大的方法轻松解决。

n 次独立抛硬币,每次出正面概率为 p,期望出多少次正面?

Solution:

  • 有 n 枚硬币,每一枚独立地以概率 p 出现正面。

  • 令随机变量 J 表示正面(heads)的总数。

  • J服从参数为 Bin(n,p)二项分布,即:

    Pr[J=k]=(nk)pk(1p)nk

  • 我们想求:

    E[J]=k=0nkPr[J=k]

这个求和确实很复杂,直接代入公式计算不现实。但我们可以换一种聪明的方式。

💡 核心思路:把总数表示为 n 个“是否是正面”的指标变量之和

我们定义 Ji 为第 i 枚硬币是否为正面的指示变量:

i={1如果第 i 枚硬币是正面0否则

这样,总的正面数 J 就是这些指示变量的总和:

J=J1+J2++Jn

由于每个 Ji 都是独立抛一次硬币得出的结果,它是 1 的概率是 p。所以最终E[J]=np

集邮员问题

我们去 Taco Bell 买儿童套餐,每次会随机得到一辆不同颜色的“小赛车”。颜色一共有 nnn 种,每种颜色被选中的概率是等概率(uniform),且每次独立。我们大约要买多少次套餐,才能收集到 每种颜色各至少一辆

image-20250601224131477

image-20250601224334598

无限求和的线性期望

如果我们有一串随机变量R0,R1,R2,​,并且它们的期望之和是绝对收敛的,那么我们可以安全地交换期望和求和:

E[i=0\infinRi]=i=0\infinE[Ri]

绝对收敛: 就是把所有的E[Ri]都变成正数再求和,结果仍然是有限的(不发散)。为什么需要这个条件——因为无穷级数在数学上很敏感——如果不绝对收敛,可能交换求和顺序会改变结果,甚至得出错误的结论。

image-20250602212932486

随机变量乘积的期望

在一般情况下,乘积的期望 ≠ 期望的乘积。但如果如果两个随机变量 R1R2独立的,那么:E[R1R2Rn]=E[R1]E[R2]E[Rn]