失败、试验和成功:负二项分布解释

Failure, Experiment, and Success Negative Binomial Distribution Explanation

深入了解一个较少知名的概率分布

Alperen Yazgı 在 Unsplash 上的照片

背景

你可能听说过二项分布,但你听说过它的表兄弟负二项分布吗?这个离散概率分布在许多行业中应用,如保险和制造业(主要是基于计数的数据),因此对于数据科学家来说,这是一个有用的概念。在本文中,我们将深入探讨这个分布及其能解决的问题。

什么是负二项分布?

要理解负二项分布,了解二项分布的直观性是很重要的。

二项分布测量在给定的一定次数的试验中,成功次数为x的概率,其中这些试验是伯努利试验,每个结果都是二元的(成功或失败)。如果你对二项分布不熟悉,请查看我之前关于它的文章:

解读二项分布:数据科学家的基本概念

理解二项分布的基本组成部分

pub.towardsai.net

负二项分布将这个过程颠倒,模拟出达到一定数量的成功之前所需的试验次数x。这就是为什么它被称为“负”的原因,因为它无意中模拟了在达到一定数量的成功之前的失败次数。

更好的思考负二项分布的方法是:

x”次试验中发生“r”次成功的概率

负二项分布的一个特例是几何分布。它模拟了在获得第一个成功之前需要进行的试验次数。你可以在这里阅读更多关于几何分布的信息: