Lec 17 随机变量
Lecture 21:随机变量
来源:MIT 6.1200J / 18.062J Mathematics for Computer Science,Spring 2024
1. 随机变量的定义
定义(随机变量): 随机变量(random variable,简称 RV)是以样本空间为定义域的全函数。
示例: 抛三枚独立公平硬币的样本空间上:
- 第一枚硬币的值(H 或 T,或编码为 0/1)
:正面朝上的总数 :三枚结果完全相同时为 1,否则为 0(指示随机变量)
定义(指示随机变量): 取值在
的随机变量称为指示随机变量(indicator random variable),也称 Bernoulli 随机变量。
随机变量与事件的互相转化:
- 对随机变量
和值 ,事件 - 对事件
,指示随机变量 若 ,否则为 0
由求和规则:
2. 随机变量的条件化与独立性
条件化示例:
(
定义(随机变量的独立性): 两个随机变量
、 独立,若对其值域中的所有 、 : $$\Pr[X = x \cap Y = y] = \Pr[X = x] \cdot \Pr[Y = y]$$ 等价地,对所有 、 ,要么 ,要么 。
骰子示例: 掷两枚公平骰子得
与 :不独立( 时 ) 与 :独立,因为 (对任意 ,恰有一个 使和为 7)
定义(互独立随机变量集合): 随机变量集合
互独立,若对所有 : $$\Pr[X_1=x_1, \ldots, X_n=x_n] = \prod_{i=1}^n \Pr[X_i=x_i]$$ 较小子集的独立性可由对多余变量求和自动得出,无需单独验证。
3. 概率质量函数与累积分布函数
定义: 对随机变量
,定义:
- 概率质量函数(probability mass function,PMF):
- 累积分布函数(cumulative distribution function,CDF):
常见分布:
Bernoulli 分布(指示随机变量):
4. 二信封问题(Two Envelope Problem)
问题: 两个信封各含 0~100 整数,不等。看到自己信封中的数后,是否应该换?
分析: 选取随机阈值
- 若
恰好在 与 之间(概率至少 ),则必然选出较大值。 - 否则以
概率成功。
意义: 这里将概率用于算法设计(随机化算法),而非仅仅建模不确定性。
5. 二项分布(Binomial Distribution)
场景: 抛
定义(二项分布 PMF): $$f_{n,p}(k) = \Pr[X = k] = \binom{n}{k} p^k (1-p)^{n-k}$$
直觉: 恰好
CDF:
Stirling 近似(选读): 对
指数部分在
数值示例(
(在均值处仍很小) (极其微小) - 事实上,
(两者均极小)