Skip to content

Lecture 20:独立性

来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024


1. 基本定义

赌徒谬误(*Gambler's Fallacy*): 误以为连续出现反面后,下一次正面的概率更大。事实上,公平硬币的每次抛掷相互独立。

定义(独立事件): 若满足下列任一等价条件,则称事件 AB 独立independent): $$\Pr[A \mid B] = \Pr[A] \quad (\text{或} \Pr[B] = 0)$$ 等价地: $$\Pr[A \cap B] = \Pr[A] \cdot \Pr[B]$$

典型示例:

  1. 互斥 不独立(概率非零时):AB=Pr[A],Pr[B]>0,则 Pr[AB]=0Pr[A]Pr[B]
  2. 抛两枚公平硬币,A = "第一枚正面",B = "第二枚正面":独立
  3. A = "第一枚正面",B = "两枚均正面":不独立Pr[AB]=1/4=Pr[A]Pr[B] 恰好成立,但 BA,知道 B 发生则 A 必然发生)。
  4. A = "第一枚正面",B = "两枚结果相同"(公平硬币):独立Pr[A]=Pr[B]=1/2Pr[AB]=1/4
  5. 若硬币有偏(正面概率为 p),同上的 AB不独立Pr[BA]=pPr[B]=p2+(1p)2

2. 多事件的独立性:互独立与两两独立

定义(互独立): 称事件 ABC 互独立mutually independent),若同时满足: $$\Pr[A \cap B] = \Pr[A]\Pr[B]$$ $$\Pr[A \cap C] = \Pr[A]\Pr[C]$$ $$\Pr[B \cap C] = \Pr[B]\Pr[C]$$ $$\Pr[A \cap B \cap C] = \Pr[A]\Pr[B]\Pr[C]$$

第四个条件不可由前三个推出! 反例:抛三枚独立公平硬币,令:

  • A:硬币 1 与 2 结果相同
  • B:硬币 2 与 3 结果相同
  • C:硬币 3 与 1 结果相同

Pr[A]=Pr[B]=Pr[C]=1/2Pr[AB]=Pr[AC]=Pr[BC]=1/4(两两独立),但:

Pr[ABC]=Pr[三枚结果相同]=1418=Pr[A]Pr[B]Pr[C]

定义(两两独立): 满足前三个条件但不满足第四个条件的事件组,称为两两独立pairwise independent)。两两独立在计算机科学中常作为互独立的替代(更易实现,往往足够用)。


3. 现实中的独立性

2016 年美国大选案例: 若假设宾夕法尼亚州(PA)、密歇根州(MI)、威斯康星州(WI)独立,

Pr[PAMIWI]0.21×0.23×0.1650.008

但这三个事件并不独立——民调系统误差、选举日因素等均可导致它们正相关。

在无任何相关性假设下,最优上界仅为最小单独概率:

Pr[PAMIWI]Pr[WI]=0.165

(因为 PAMIWIWI


4. 条件独立性(Conditional Independence

定义: 若满足 $$\Pr[A \mid C] \cdot \Pr[B \mid C] = \Pr[A \cap B \mid C]$$ 则称 AB 在给定 C 的条件下条件独立conditionally independent given C)。

重要观察: 独立性与因果性无关!条件化第三个事件可在两个因果无关的事件之间引入依赖。

约会模型示例:A = "有吸引力",N = "好相处",R = "有吸引力或好相处"(浪漫有趣)。AN 原本独立(各以 1/2 概率成立),但在给定 R 的条件下:

Pr[AR]=23,Pr[NR]=23,Pr[ANR]=1349

Pr[ARN]=1/2<Pr[AR]=2/3:有吸引力与好相处在 R 的条件下负相关,但两者之间并无因果关系!


5. 补充:生日原理(Birthday Principle

d 个人各自生日均匀独立地取自 n 天,无两人同天生日的概率为:

Pr[无碰撞]=n1nn2nn(d1)n

利用 1xex

Pr[无碰撞]e1/ne2/ne(d1)/n=ed(d1)2n

d(d1)n 时此上界接近于 1/e,即 dn。对于 n=365,需 d=23 人才使碰撞概率超过 1/2

"平方根"效应在哈希、密码学、随机数据测试中有重要应用。


6. 补充:重新审视赌徒谬误

若真正抛出 50 次正面,理性应当怀疑硬币有偏,下一次预测正面才合理——这恰好与赌徒谬误相反!

用贝叶斯方法形式化:

Pr[HH50]=1Pr[有偏H50]+12Pr[公平H50]

随着观测到的正面次数增多,Pr[有偏H50] 不断增大,Pr[HH50] 趋向于 1。