首页 > 代码库 > 二项分布与泊松分布

二项分布与泊松分布

最近学习了基因组组装的课程,其中在使用kmer估算基因组大小时,讲到了二项分布和泊松分布,课程把它们的由来和关系讲得十分透彻,同时与具体实例相结合,本文再对它做一个总结。

通过这个例子也会真实的感受到数学的神奇,数学公式的变换,奇妙的证明,最神奇的是它的应用,让我想起了一本很有名但我一直都没有去看的书--《数学之美》

 

正文:二项分布和泊松分布的关系

定义

二项分布:P(X=k)=Cnkpk(1-p)(n-k)

抛硬币,假设硬币不平整,抛出正面的概率为p,那么在n次抛硬币的实验中,出现k次正面的概率

泊松分布: p(X=k)=λke/k!

公共汽车站在单位时间内,来乘车的乘客数为k 的概率。假定平均到站乘客数为λ

二项分布和泊松分布的关系

n很大,p很小时泊松分布可以用来近似二项分布,此时 λ=np

二者关系的直观解释:

从泊松分布说起。把单位时间分成n等分,称为n个时间窗口。那么在某个时间窗口来一个客人的概率为λ/n.(稍后解释,其实这是不对的)那么我们可以将泊松分布和二项分布对应起来:在某个时间窗口里来了乘客 对应 抛出正面硬币;来了k个客人 对应 抛出k个正面。因此,泊松分布和二项分布近似了。

二项分布与泊松分布