首页 > 代码库 > 二项分布的近似检测

二项分布的近似检测

      例1,为了节约能源,某地区政府鼓励人们拼车出行,采取的措施是在指定的某些高速公路上,载有2人以上的车辆减收道路通行费。为了评价该项措施的效果,随机抽取了未减收路费路段的车辆2000辆,和减收路费路段的车辆1500辆,发现分别有652辆和576辆是两人以上的,这些数据能否说明该措施能提高合乘汽车的比率?

      分析:

      该案例可以采用二项分布的近似检验方法,设检验

                                                                      H0: p1=p2 ,      H1: p1≠p2

      调用的函数是prop.test(),代码如下:

> n <- c(2000,1500)
> x <- c(652,576)
> prop.test(x,n)
        2-sample test for equality of proportions with continuity
        correction


data:  x out of n 
X-squared = 12.4068, df = 1, p-value = http://www.mamicode.com/0.0004278
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.09064286 -0.02535714 
sample estimates:
prop 1 prop 2 
 0.326  0.384 

   

       在输出中,有X^2统计量(X-squared,卡方分布)、自由度(df)、P值(p-value)和比率差的置信区间,以及p1和p2的估计值。           

       自由度df = 1 ,概率 P = 0.0004278,置信区间为[-0.0906, -0.0254] ,比率 p1 = 0.326, 比率 p2 = 0.384

       P值(=0.0004278)  << 0.05,拒绝原假设H0,即这两组数据的比例不相同,置信区间[-0.0906, -0.0254] < 0,说明 p1 < p2,即这项措施的实施,有助于提高合乘汽车的比率。

       注意:当Z~N(0,1)时,有Z^2 ~ X^2(1),所以 prop.test()函数没有使用正态分布作检验,而是采用X^2 分布作检验。这样做的优点是,很容易将两个总体的假设检验方法,推广到m(≥3)个总体的检验中。

二项分布的近似检测