首页 > 代码库 > 二项分布的近似检测
二项分布的近似检测
例1,为了节约能源,某地区政府鼓励人们拼车出行,采取的措施是在指定的某些高速公路上,载有2人以上的车辆减收道路通行费。为了评价该项措施的效果,随机抽取了未减收路费路段的车辆2000辆,和减收路费路段的车辆1500辆,发现分别有652辆和576辆是两人以上的,这些数据能否说明该措施能提高合乘汽车的比率?
分析:
该案例可以采用二项分布的近似检验方法,设检验
H0: p1=p2 , H1: p1≠p2
调用的函数是prop.test(),代码如下:
> n <- c(2000,1500) > x <- c(652,576) > prop.test(x,n)2-sample test for equality of proportions with continuity
correction
data: x out of n
X-squared = 12.4068, df = 1, p-value = http://www.mamicode.com/0.0004278
alternative hypothesis: two.sided
95 percent confidence interval:
-0.09064286 -0.02535714
sample estimates:
prop 1 prop 2
0.326 0.384
在输出中,有X^2统计量(X-squared,卡方分布)、自由度(df)、P值(p-value)和比率差的置信区间,以及p1和p2的估计值。
自由度df = 1 ,概率 P = 0.0004278,置信区间为[-0.0906, -0.0254] ,比率 p1 = 0.326, 比率 p2 = 0.384
P值(=0.0004278) << 0.05,拒绝原假设H0,即这两组数据的比例不相同,置信区间[-0.0906, -0.0254] < 0,说明 p1 < p2,即这项措施的实施,有助于提高合乘汽车的比率。
注意:当Z~N(0,1)时,有Z^2 ~ X^2(1),所以 prop.test()函数没有使用正态分布作检验,而是采用X^2 分布作检验。这样做的优点是,很容易将两个总体的假设检验方法,推广到m(≥3)个总体的检验中。
二项分布的近似检测