合聚咖

合聚咖

必知必会统计学 | 统计学9大概率分布知多少

admin

概率分布是描述随机变量取值概率规律的工具。事件概率表示试验中某结果发生的可能性。全面了解试验,需知所有可能结果及概率。随机变量的概率分布,即可能取值与取值概率。根据变量类型,分布形式不同。

01 离散型分布

伯努利分布:变量X取值为1或0,概率分别为p和1-p。EX和DX分别是期望值和方差。试验成功次数服从该分布,参数p为成功概率。伯努利分布是二项分布的特殊情况,纪念了瑞士科学家詹姆斯·伯努利。

二项分布:描述n次独立重复试验中事件A恰好发生k次的概率。变量X取值为0到n,参数p为每次试验中事件A发生的概率。

泊松分布:描述单位时间或面积内事件发生k次的概率,参数λ为平均次数。

超几何分布:描述不放回抽样情况下,从N个球中随机抽n个球中红色球的个数。

02 连续型分布

均匀分布:概率分布等可能,定义在区间[a, b]内,参数为最小值a和最大值b。

贝塔分布:作为伯努利和二项分布的共轭先验分布,在机器学习和数理统计中有重要应用。

高斯分布(正态分布):广泛应用于实际场景,对随机变量取值范围为实数,一无所知时通常假设服从正态分布。

指数分布:事件前后两次发生的时间间隔服从此分布,连续分布。

伽马分布:事件第 i 次发生和第 i+k 次发生的时间间隔为伽玛分布,也是连续分布。

以上内容涵盖了概率分布中的主要概念,希望对读者有所帮助。关注微信公众号“数据之魅”,获取更多精彩内容。如需转载,请联系授权。