概率分布是描述随机变量取值概率规律的工具。事件概率表示试验中某结果发生的可能性。全面了解试验,需知所有可能结果及概率。随机变量的概率分布,即可能取值与取值概率。根据变量类型,分布形式不同。
01 离散型分布
伯努利分布:变量X取值为1或0,概率分别为p和1-p。EX和DX分别是期望值和方差。试验成功次数服从该分布,参数p为成功概率。伯努利分布是二项分布的特殊情况,纪念了瑞士科学家詹姆斯·伯努利。
二项分布:描述n次独立重复试验中事件A恰好发生k次的概率。变量X取值为0到n,参数p为每次试验中事件A发生的概率。
泊松分布:描述单位时间或面积内事件发生k次的概率,参数λ为平均次数。
超几何分布:描述不放回抽样情况下,从N个球中随机抽n个球中红色球的个数。
02 连续型分布
均匀分布:概率分布等可能,定义在区间[a, b]内,参数为最小值a和最大值b。
贝塔分布:作为伯努利和二项分布的共轭先验分布,在机器学习和数理统计中有重要应用。
高斯分布(正态分布):广泛应用于实际场景,对随机变量取值范围为实数,一无所知时通常假设服从正态分布。
指数分布:事件前后两次发生的时间间隔服从此分布,连续分布。
伽马分布:事件第 i 次发生和第 i+k 次发生的时间间隔为伽玛分布,也是连续分布。
以上内容涵盖了概率分布中的主要概念,希望对读者有所帮助。关注微信公众号“数据之魅”,获取更多精彩内容。如需转载,请联系授权。