首页 > 代码库 > (四)概率
(四)概率
老习惯,还是先给出该章节的思维导图让大家先有个总体的概念
对于基础概念就不在此赘述,挑当中的几个easy混淆的点和关键点说说
首先便是相互排斥事件与独立事件,非常多人会将两者混淆。有个样例非常好的说明了两者不是一回事:
假设两个事件是相互排斥事件,当中之中的一个被确定已经发生,则还有一事件发生的概率降为0,显然两者是相关的。
其次为何要引入条件概率呢? 这是由于现实生活中相互独立的事件非常少,大多数事件的发生都与其它事件有关联,计算他们发生的概率时我们就须要採用条件概率的方式,当然假设两个事件是相互独立的就不必在意该事件的发生是否受其它事件的影响了。
贝叶斯定理是十分重要的一个定理,再次仅作简介,之后会有博文细说贝叶斯定理。 (也能够看看刘未鹏写的关于贝叶斯的博文)
非常多情况下我们对我们关心的事件能够给出一个先验概率预计,然后随着我们的调查研究我们将会得到很多其它的新信息,于是我们便能够利用这些新信息对我们的先验概率进行纠正得到该事件的后验概率。贝叶斯定理就是这种概率分析手段。
【先验概率->新信息->应用贝叶斯定理->后验概率】
贝叶斯定理广泛应用于决策分析中。先验概率一般是由决策者主观预计的。在进行战略决策时,会在取得样本信息后计算后验概率以供决策者使用。
-----------------------------------------------------------------------------------------------------------------------------------------------------------
二项试验的性质
(1) 试验由一个包含 n次同样的试验的序列组成。
(2) 每次试验有两种可能结果。我们把当中一个称为成功,还有一个称为失败。
(3) 成功的概率,用p来表示,各个试验都同样。于是,失败的概率用1-p表示,也都同样。 【稳定性如果】
(4) 试验都是独立的。 【实验的独立性】
-------------------------------------------------------------------------------------------------------------------------------------------------------------
泊松分布是一个十分重要的分布,它主要用于预计某事件在特定的时间段或空间中发生的次数
--------------------------------------------------------------------------------------------------------------------------
泊松试验的性质
1、在随意两个相等长度的区间上事件发生一次的概率是相等的
2、事件在某一区间上发生或者不发生与其它区间上事件是否发生是无关的
---------------------------------------------------------------------------------------------------------------------------
泊松分布另一个比較重要的特性是其期望与方差是相等的。
超几何分布的期望为n*(r/N),方差为n*(r/N)*(1-r/N)*((N-n)/(N-1)),当N足够大的时候,记r/N为p,则期望为np,方差为np(1-p),显然在此情况下,超几何分布可用二项分布逼近。
连续型随机变量和离散随机变量的差别:
1、不再讨论随机变量取某一特定值的概率。取代地,讨论随机变量在某一给定区间取值的概率。
2、随机变量在从 x1到x2间的某一给定区间取值的概率被定义为概率密度函数在 x1与x2间的图形的面积。
正态分布是十分重要的分布
性质:
正态概率分布有一个完整家族。每一特定正态分布通过其均值 μ 、标准差 σ 来区分。
正态曲线的最高点在均值,它也是分布的中位数和众数
分布的均值能够是随意数值:负数、零或正数。
正态概率分布是对称的。
曲线的尾端向两个方向无限延伸,且理论上永远不会与横轴相交。
标准差决定曲线的宽度
正态概率分布曲线下的总面积是 1,对全部的连续型概率分布都是如此。
正态随机变量的概率由曲线以下积给出。一些经常使用区间的概率是68.26%,95.44%,99.72%
连续修正因子:当用连续正态概率分布来近似离散二项概率分布时,从x值加减的0. 5值。
指数分布与泊松分布的关系在于,假设泊松分布给出了每一间隔中发生次数的适当描写叙述,则指数分布可给出两次发生之间间隔长度的描写叙述。
PS: 指数分布是偏度为2的严重右偏分布。