首页 > 代码库 > 大树定理(LOLN)应用

大树定理(LOLN)应用

1.背景

     为了调查上海市的平均工资,怎么才能得到一个比较真实的值。

2.分析

    一个可行的方法是可以通过抽样来计算平均工资,即通过样本的均值来估计总体的均值。

    LOLN:

        The average of many independent samplesis(withhighprobability) close to the mean of the underlying distribution.

   可以认为工资服从正太分布,那么这个样本取多大,也就是说要做多少份调查问卷。

   大树定律表明在样本很大的情况下,样本的平均值接近总体平均值,用数学表示为:

                         P(|X - 0.5|< 0.1) =1  X 代表样本空间n的均值 | p( 0.4 < x< 0.6) =1

3.方案

   1.  假设样本空间 n = 10

     取样本服从均匀分布,也就是各行各业取得样本概率是一样的,p(x) = 1/10 , E(x) = 0.6 当样本空间中取到第六次时候, E(x) = 0.6

    同理, E(x)= 0.4 取到第4次

    假设工资遵从正太分布 :

   pbinom(6, 10 , 0.5) - pbinom(4, 10 ,0.5) =   0.4511719

   这个结果远小于1, 说明取得样本太少, 不确定性因素太多

   假设样本总数n = 100

   pbinom(60,100,0.5) - pbinom(39,100,0.5) = 0.9647998

   假设样本总数 n = 1000

   pbinom(600,1000,0.5) - pbinom(400,1000,0.5)  =1

 4.结论

    如果样本空间总数取到1000,也就是发1000份调查问卷, 即可得到平均工资。概率为1说明必然事件。

 

大树定理(LOLN)应用