Lecture 24:大偏差界——切比雪夫与切尔诺夫界
来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024
1. 方差回顾
定义(方差): 随机变量
的方差(variance)为: $$\text{Var}[R] = \mathbb{E}\left[(R - \mathbb{E}[R])^2\right]$$ 标准差(standard deviation) 。
等价计算公式:
证明:
定理: 若
两两独立,则: $$\text{Var}[R_1 + \cdots + R_n] = \text{Var}[R_1] + \cdots + \text{Var}[R_n]$$
警告:
2. 马尔可夫不等式(Markov's Inequality)
定理(马尔可夫不等式): 设
为非负随机变量,则对任意 : $$\Pr[R \geq x] \leq \frac{\mathbb{E}[R]}{x}$$ 等价形式: 。
证明:
整理即得。
非负性的必要性: 若
实用技巧:调整界
若
- 应用于
(非负)得到更紧的上侧界 - 应用于
(非负)得到下侧界
示例: 成绩
- 直接用马尔可夫:
- 对
用马尔可夫: (更紧)
马尔可夫界的松紧性
- 懒苏珊转盘版手机问题:
(马尔可夫),真实值也是 ——紧! - 袋中取手机版:
(马尔可夫),真实值是 ——非常松!
3. 切比雪夫不等式(Chebyshev's Inequality)
定理(切比雪夫不等式): 对任意随机变量
(无需非负)和 : $$\Pr[|R - \mathbb{E}[R]| \geq x] \leq \frac{\text{Var}[R]}{x^2} = \left(\frac{\sigma(R)}{x}\right)^2$$ 等价形式: 。
证明(对马尔可夫的应用):
对非负随机变量
示例一(成绩):
(距均值 2 个标准差,概率
示例二(
远优于马尔可夫给出的
4. 切尔诺夫界(Chernoff Bound)
定理(切尔诺夫界): 设
为互独立随机变量,且 ,令 。则对所有 : $$\Pr[T \geq c \cdot \mathbb{E}[T]] \leq e^{-(c \ln c - c + 1) \cdot \mathbb{E}[T]}$$
证明思路: 对随机变量
应用(
这是指数级改进,远优于切比雪夫的
集中性示例(令
正面次数以极高概率集中在均值
5. 三种界的对比
| 方法 | 所需条件 | 界的形式 | |
|---|---|---|---|
| 马尔可夫 | |||
| 切比雪夫 | 无(需方差) | ||
| 切尔诺夫 | 互独立,有界 | 指数级 |
依赖关系: 切比雪夫只需两两独立,切尔诺夫需要互独立,换来更强的指数级界。