【超几何分布的期望和方差】在概率论与数理统计中,超几何分布是一种离散型概率分布,用于描述在不放回抽样情况下,成功次数的概率分布。它常用于从有限总体中进行抽样的情况,例如从一批产品中抽取样本检测合格率等。
超几何分布的定义如下:设一个总体包含 $ N $ 个个体,其中 $ K $ 个是“成功”个体,其余为“失败”个体。从中随机抽取 $ n $ 个个体(不放回),则成功次数 $ X $ 的概率分布服从超几何分布,记作 $ X \sim H(N, K, n) $。
项目 | 公式 | 说明 |
期望(均值) | $ E(X) = n \cdot \frac{K}{N} $ | 表示在 $ n $ 次抽样中,平均能抽到的成功次数 |
方差 | $ Var(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ | 反映了成功次数的波动程度,与二项分布相比,多了一个有限总体校正因子 |
说明与理解
- 期望:超几何分布的期望与二项分布类似,都是 $ n \cdot p $,其中 $ p = \frac{K}{N} $。这表明,在不放回抽样中,平均每次抽到成功的概率仍为 $ \frac{K}{N} $。
- 方差:超几何分布的方差比二项分布小,这是因为不放回抽样减少了样本之间的独立性,导致方差减小。这个差异由因子 $ \frac{N - n}{N - 1} $ 来体现,称为“有限总体校正因子”。
应用举例
假设有一批产品共 100 件,其中有 20 件是次品。从中随机抽取 10 件进行检查,求抽到次品数的期望和方差:
- $ N = 100 $, $ K = 20 $, $ n = 10 $
- 期望:$ E(X) = 10 \cdot \frac{20}{100} = 2 $
- 方差:$ Var(X) = 10 \cdot \frac{20}{100} \cdot \left(1 - \frac{20}{100}\right) \cdot \frac{100 - 10}{100 - 1} = 10 \cdot 0.2 \cdot 0.8 \cdot \frac{90}{99} \approx 1.4545 $
总结
超几何分布在实际问题中具有广泛的应用价值,尤其是在抽样调查、质量控制等领域。其期望和方差的计算虽然略复杂,但通过合理的数学推导可以得到准确的结果。理解这些统计量有助于我们更好地分析和预测在不放回抽样中的结果变化趋势。