首页 > 代码库 > 概率论快速学习01:计数

概率论快速学习01:计数


2014-05-15 22:02 by Jeff Li

前言

  系列文章:[传送门]

  马上快要期末考试了,为了学点什么。就准备这系列的博客,记录复习的成果。

     

正文-计数  

概率

  概率论研究随机事件。它源于赌徒的研究。即使是今天,概率论也常用于赌博。随机事件的结果是否只凭运气呢?高明的赌徒发现了赌博中的规律。尽管我无法预知事件的具体结果,但我可以了解每种结果出现的可能性。这是概率论的核心。

  “概率”到底是什么?这在数学上还有争议。“频率派”认为概率是重复尝试多次,某种结果出现的次数在尝试的总次数的比例。“贝叶斯派”认为概率是主观信念的强弱。幸好,这些争议并不影响我们在日常生活中使用“概率”哲学。天气预报的降雨概率为80%时,很多人会因此带上伞。报纸会分析一场球赛某支球队的赢球概率,如果最终赢球概率为10%的球队取胜,那么球迷会感到惊讶。这结果是小概率事件。

  要知道某个结果的概率并不容易。上面分析球队的赢球概率,要考虑许多因素。投一个骰子,有6种可能的结果。物理情况会影响结果的概率,比如撒子是否均匀,比如掷撒子的人是否有技巧偏向。如果骰子是均匀的,且没有作弊,那么每种结果出现的概率相同。为了能从数学上给结果分配一个概率,我们往往会加上一些假设。这些假设有理想化的成份,但并不至于偏离现实。比如,我们说掷撒子,撒子均匀,掷的人也没有什么特殊手法,并由此推断每种结果出现的可能相同。那么,其中任意一个结果出现的概率为1/6。

                              

                     

 

基本计数原理

计数的基本原理叙述如下:

  如果一个实验可以分为m个步骤,每个步骤分别有n1,n2,...,nm种可能,那么总共会下面 有种可能的结果。

n1×n2×...×nm

 

 

  基本技术原理的核心是“分步”。对于简单的一个步骤的事情,我们能比较直接的分辨结果的总数。

 

有序的重复抽样

  从数学上来说,如果进行m次有放回的抽样,每次抽样都有n种可能。如果最终结果有序,那么将有nm种可能。

 

考虑下面的问题:

  • 一个骰子连续掷2次,所有可能的结果有多少个?

模拟例子:(python系列文章)

复制代码
import itertools

a = [1, 2, 3, 4, 5, 6]
outcomes = list(itertools.product(a, a))

print(outcomes)
print(len(outcomes))
复制代码

 

#itertools 相关文档

 

会有下面的结果:

复制代码
[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), 
 (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (2, 6), 
 (3, 1), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), 
 (4, 1), (4, 2), (4, 3), (4, 4), (4, 5), (4, 6), 
 (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6), 
 (6, 1), (6, 2), (6, 3), (6, 4), (6, 5), (6, 6)]

36
复制代码

#所以出现的概率P=1/36

 

有序的非重复抽样

   有序的非重复抽样又叫做排列(permutation)。从数学上来说,从n个样品中挑选m个,放入m个位置,将有n×(n?1)×...×(n?m+1)种可能。如果我们使用阶乘(factorial)运算符,那么结果可以表示为

 n!(n?m)!

 

 #其中,n!=1×2×...×(n?1)×n

 

 考虑下面的问题:

我们用下面的程序来模拟队长组合的状况:

复制代码
import itertools

a = ["Tom", "Lee", "King", "James"]
outcomes = list(itertools.permutations(a, 2))

print(outcomes)
print(len(outcomes))
复制代码

 

# 相关文档

 

结果为

[(‘Tom‘, ‘Lee‘), (‘Tom‘, ‘King‘), (‘Tom‘, ‘James‘), 
 (‘Lee‘, ‘Tom‘), (‘Lee‘, ‘King‘), (‘Lee‘, ‘James‘), 
 (‘King‘, ‘Tom‘), (‘King‘, ‘Lee‘), (‘King‘, ‘James‘), 
 (‘James‘, ‘Tom‘), (‘James‘, ‘Lee‘), (‘James‘, ‘King‘)]

#共有12种可能的结果。

 

无序的非重复抽样

  m个样品有m!种排列方式。如果是从n个样品中抽取m个作为组合,所有的这m!种排序方式应该看做一种。因此,有n!(n?m)!m!种可能结果。我们可以用下面的方式记录组合:

 

(nm)=n!(n?m)!m!

 

 

考虑下面的问题:

  • 从4个人中抽出2个人,有多少种可能?

 

下面来模拟:

复制代码
import itertools

a = ["Tom", "Lee", "King", "James"]
outcomes = list(itertools.combinations(a, 2))

print(outcomes)
print(len(outcomes))
复制代码

 

#相关文档

 

有以下结果

[(‘Tom‘, ‘Lee‘), (‘Tom‘, ‘King‘), (‘Tom‘, ‘James‘),
 (‘Lee‘, ‘King‘), (‘Lee‘, ‘James‘),
 (‘King‘, ‘James‘)]

#可以看到,从4个中挑选2个,有6种可能的组合。这是排列的一半。

 

无序的重复抽样

概括来讲,从n个样品中,无序的重复抽样m次,有

 

(n+m?1m?1)

 

 

 

 

阶乘与组合

我们在上面多次使用了阶乘运算,在Python中,它可以使用math.factorial实现:

import math
print(math.factorial(5))

 总结

  

  基本计数原理

  排列

  组合

  (生活离不开寻找数学,你说呢?)

  

 

 

感谢及资源共享

    

    路上走来一步一个脚印,希望大家和我一起。

    感谢读者!很喜欢你们给我的支持。如果支持,点个赞。

    知识来源: 概率论等书 和 python api