首页 > 代码库 > 大树定理(LOLN)应用
大树定理(LOLN)应用
1.背景
为了调查上海市的平均工资,怎么才能得到一个比较真实的值。
2.分析
一个可行的方法是可以通过抽样来计算平均工资,即通过样本的均值来估计总体的均值。
LOLN:
The average of many independent samplesis(withhighprobability) close to the mean of the underlying distribution.
可以认为工资服从正太分布,那么这个样本取多大,也就是说要做多少份调查问卷。
大树定律表明在样本很大的情况下,样本的平均值接近总体平均值,用数学表示为:
P(|X - 0.5|< 0.1) =1 X 代表样本空间n的均值 | p( 0.4 < x< 0.6) =1
3.方案
1. 假设样本空间 n = 10
取样本服从均匀分布,也就是各行各业取得样本概率是一样的,p(x) = 1/10 , E(x) = 0.6 当样本空间中取到第六次时候, E(x) = 0.6
同理, E(x)= 0.4 取到第4次
假设工资遵从正太分布 :
pbinom(6, 10 , 0.5) - pbinom(4, 10 ,0.5) = 0.4511719
这个结果远小于1, 说明取得样本太少, 不确定性因素太多
假设样本总数n = 100
pbinom(60,100,0.5) - pbinom(39,100,0.5) = 0.9647998
假设样本总数 n = 1000
pbinom(600,1000,0.5) - pbinom(400,1000,0.5) =1
4.结论
如果样本空间总数取到1000,也就是发1000份调查问卷, 即可得到平均工资。概率为1说明必然事件。
大树定理(LOLN)应用