Lecture 20:独立性
来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024
1. 基本定义
赌徒谬误(*Gambler's Fallacy*): 误以为连续出现反面后,下一次正面的概率更大。事实上,公平硬币的每次抛掷相互独立。
定义(独立事件): 若满足下列任一等价条件,则称事件
、 独立(independent): $$\Pr[A \mid B] = \Pr[A] \quad (\text{或} \Pr[B] = 0)$$ 等价地: $$\Pr[A \cap B] = \Pr[A] \cdot \Pr[B]$$
典型示例:
- 互斥
不独立(概率非零时): 若 且 ,则 。 - 抛两枚公平硬币,
= "第一枚正面", = "第二枚正面":独立。 = "第一枚正面", = "两枚均正面":不独立( 恰好成立,但 ,知道 发生则 必然发生)。 = "第一枚正面", = "两枚结果相同"(公平硬币):独立, , 。 - 若硬币有偏(正面概率为
),同上的 、 :不独立, 。
2. 多事件的独立性:互独立与两两独立
定义(互独立): 称事件
、 、 互独立(mutually independent),若同时满足: $$\Pr[A \cap B] = \Pr[A]\Pr[B]$$ $$\Pr[A \cap C] = \Pr[A]\Pr[C]$$ $$\Pr[B \cap C] = \Pr[B]\Pr[C]$$ $$\Pr[A \cap B \cap C] = \Pr[A]\Pr[B]\Pr[C]$$
第四个条件不可由前三个推出! 反例:抛三枚独立公平硬币,令:
:硬币 1 与 2 结果相同 :硬币 2 与 3 结果相同 :硬币 3 与 1 结果相同
则
定义(两两独立): 满足前三个条件但不满足第四个条件的事件组,称为两两独立(pairwise independent)。两两独立在计算机科学中常作为互独立的替代(更易实现,往往足够用)。
3. 现实中的独立性
2016 年美国大选案例: 若假设宾夕法尼亚州(PA)、密歇根州(MI)、威斯康星州(WI)独立,
但这三个事件并不独立——民调系统误差、选举日因素等均可导致它们正相关。
在无任何相关性假设下,最优上界仅为最小单独概率:
(因为
4. 条件独立性(Conditional Independence)
定义: 若满足 $$\Pr[A \mid C] \cdot \Pr[B \mid C] = \Pr[A \cap B \mid C]$$ 则称
与 在给定 的条件下条件独立(conditionally independent given C)。
重要观察: 独立性与因果性无关!条件化第三个事件可在两个因果无关的事件之间引入依赖。
约会模型示例: 设
且
5. 补充:生日原理(Birthday Principle)
利用
当
"平方根"效应在哈希、密码学、随机数据测试中有重要应用。
6. 补充:重新审视赌徒谬误
若真正抛出 50 次正面,理性应当怀疑硬币有偏,下一次预测正面才合理——这恰好与赌徒谬误相反!
用贝叶斯方法形式化:
随着观测到的正面次数增多,