Skip to content

Lecture 24:大偏差界——切比雪夫与切尔诺夫界

来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024


1. 方差回顾

定义(方差): 随机变量 R方差variance)为: $$\text{Var}[R] = \mathbb{E}\left[(R - \mathbb{E}[R])^2\right]$$ 标准差standard deviationσ(R)=Var[R]

等价计算公式:

Var[R]=E[R2]E[R]2

证明:

Var[R]=E[(RE[R])2]=E[R22E[R]R+E[R]2]=E[R2]E[R]2

定理:R1,,Rn 两两独立,则: $$\text{Var}[R_1 + \cdots + R_n] = \text{Var}[R_1] + \cdots + \text{Var}[R_n]$$

警告: σ(R1+R2)σ(R1)+σ(R2)(即使独立),但 σ(R1+R2)2=σ(R1)2+σ(R2)2(独立时成立)。


2. 马尔可夫不等式(Markov's Inequality

定理(马尔可夫不等式):R非负随机变量,则对任意 x>0: $$\Pr[R \geq x] \leq \frac{\mathbb{E}[R]}{x}$$ 等价形式:Pr[RcE[R]]1c

证明:

E[R]=E[RRx]Pr[Rx]+E[RR<x]Pr[R<x]xPr[Rx]+0

整理即得。

非负性的必要性:R 可取负值,则 E[RR<x] 不再非负,不等式失效。

实用技巧:调整界

R 的取值范围为 [,u],可灵活变换:

  • 应用于 R(非负)得到更紧的上侧界
  • 应用于 uR(非负)得到下侧界

示例: 成绩 R[30,100]E[R]=75,估计 Pr[R90]

  • 直接用马尔可夫:75/900.833
  • R30 用马尔可夫:E[R30]/60=45/60=0.75(更紧)

马尔可夫界的松紧性

  • 懒苏珊转盘版手机问题:Pr[Rn]1/n(马尔可夫),真实值也是 1/n——紧!
  • 袋中取手机版:Pr[Rn]1/n(马尔可夫),真实值是 1/n!——非常松!

3. 切比雪夫不等式(Chebyshev's Inequality

定理(切比雪夫不等式): 对任意随机变量 R(无需非负)和 x>0: $$\Pr[|R - \mathbb{E}[R]| \geq x] \leq \frac{\text{Var}[R]}{x^2} = \left(\frac{\sigma(R)}{x}\right)^2$$ 等价形式:Pr[|RE[R]|cσ(R)]1c2

证明(对马尔可夫的应用):

对非负随机变量 (RE[R])2 应用马尔可夫:

Pr[|RE[R]|x]=Pr[(RE[R])2x2]E[(RE[R])2]x2=Var[R]x2

示例一(成绩): E[score]=75Var[score]=25σ=5,估计 Pr[score65]

Pr[score65]Pr[|score75|10]25100=0.25

(距均值 2 个标准差,概率 1/4

示例二(n 次抛硬币): R = 正面数,E[R]=n/2Var[R]=n/4

Pr[R3n4]Pr[|Rn2|n4]n/4(n/4)2=4n

远优于马尔可夫给出的 2/3


4. 切尔诺夫界(Chernoff Bound

定理(切尔诺夫界):T1,,Tn互独立随机变量,且 0Ti1,令 T=Ti。则对所有 c1: $$\Pr[T \geq c \cdot \mathbb{E}[T]] \leq e^{-(c \ln c - c + 1) \cdot \mathbb{E}[T]}$$

证明思路: 对随机变量 cT 应用马尔可夫,利用独立性展开。

应用(n 次抛硬币,c=3/2):

Pr[R3n4]=Pr[R32n2]e0.1n/2=en/20

这是指数级改进,远优于切比雪夫的 4/n

集中性示例(令 c=1+4/n): 对足够大的 n

Pr[Rn2+2n]0.02

正面次数以极高概率集中在均值 n/2 附近 n 量级的范围内,分布随 n 增大越来越集中。


5. 三种界的对比

方法所需条件界的形式n 次抛硬币 Pr[R3n/4]
马尔可夫R0E[R]/x2/3(非常松)
切比雪夫无(需方差)Var[R]/x24/n
切尔诺夫互独立,有界指数级en/20(指数紧)

依赖关系: 切比雪夫只需两两独立,切尔诺夫需要互独立,换来更强的指数级界。