首页 > 代码库 > (四)概率
(四)概率
老习惯,还是先给出该章节的思维导图让大家先有个整体的概念
对于基础概念就不在此赘述,挑其中的几个容易混淆的点和关键点说说
首先便是互斥事件与独立事件,很多人会将两者混淆。有个例子很好的说明了两者不是一回事:
如果两个事件是互斥事件,其中之一被确定已经发生,则另一事件发生的概率降为0,显然两者是相关的。
其次为何要引入条件概率呢? 这是因为现实生活中相互独立的事件很少,大多数事件的发生都与其他事件有关联,计算他们发生的概率时我们就需要采用条件概率的方式,当然如果两个事件是相互独立的就不必在意该事件的发生是否受其他事件的影响了。
贝叶斯定理是十分重要的一个定理,再次仅作简单介绍,之后会有博文细说贝叶斯定理。 (也可以看看刘未鹏写的关于贝叶斯的博文)
很多情况下我们对我们关心的事件可以给出一个先验概率估计,然后随着我们的调查研究我们将会得到更多的新信息,于是我们便可以利用这些新信息对我们的先验概率进行纠正得到该事件的后验概率。贝叶斯定理就是这样的概率分析手段。
【先验概率->新信息->应用贝叶斯定理->后验概率】
贝叶斯定理广泛应用于决策分析中。先验概率通常是由决策者主观估计的。在进行战略决策时,会在取得样本信息后计算后验概率以供决策者使用。
-----------------------------------------------------------------------------------------------------------------------------------------------------------
二项试验的性质
(1) 试验由一个包括 n次相同的试验的序列组成。
(2) 每次试验有两种可能结果。我们把其中一个称为成功,另一个称为失败。
(3) 成功的概率,用p来表示,各个试验都相同。于是,失败的概率用1-p表示,也都相同。 【稳定性假设】
(4) 试验都是独立的。 【实验的独立性】
-------------------------------------------------------------------------------------------------------------------------------------------------------------
泊松分布是一个十分重要的分布,它主要用于估计某事件在特定的时间段或空间中发生的次数
--------------------------------------------------------------------------------------------------------------------------
泊松试验的性质
1、在任意两个相等长度的区间上事件发生一次的概率是相等的
2、事件在某一区间上发生或者不发生与其他区间上事件是否发生是无关的
---------------------------------------------------------------------------------------------------------------------------
泊松分布还有一个比较重要的特性是其期望与方差是相等的。
超几何分布的期望为n*(r/N),方差为n*(r/N)*(1-r/N)*((N-n)/(N-1)),当N足够大的时候,记r/N为p,则期望为np,方差为np(1-p),显然在此情况下,超几何分布可用二项分布逼近。
连续型随机变量和离散随机变量的区别:
1、不再讨论随机变量取某一特定值的概率。代替地,讨论随机变量在某一给定区间取值的概率。
2、随机变量在从 x1到x2间的某一给定区间取值的概率被定义为概率密度函数在 x1与x2间的图形的面积。
正态分布是十分重要的分布
性质:
正态概率分布有一个完整家族。每一特定正态分布通过其均值 μ 、标准差 σ 来区分。
正态曲线的最高点在均值,它也是分布的中位数和众数
分布的均值可以是任意数值:负数、零或正数。
正态概率分布是对称的。
曲线的尾端向两个方向无限延伸,且理论上永远不会与横轴相交。
标准差决定曲线的宽度
正态概率分布曲线下的总面积是 1,对所有的连续型概率分布都是如此。
正态随机变量的概率由曲线下面积给出。一些常用区间的概率是68.26%,95.44%,99.72%
连续修正因子:当用连续正态概率分布来近似离散二项概率分布时,从x值加减的0. 5值。
指数分布与泊松分布的关系在于,如果泊松分布给出了每一间隔中发生次数的适当描述,则指数分布可给出两次发生之间间隔长度的描述。
PS: 指数分布是偏度为2的严重右偏分布。