首页 > 代码库 > 概率统计&假设检验-1

概率统计&假设检验-1

看实验的时候感觉自己在统计方面好欠缺

所以现在来填坑=。=

××××××××××××我是快乐的小学渣××××××××××××××××××××××××××××××××××

(参考http://blog.sina.com.cn/s/blog_6b1c9ed50101l02a.html)

(1)p-value:表征了在原假设成立的条件下,重复进行当前的试验,获得现有统计量t及其更极端情况的概率。

用来判断是否拒绝原假设。如果p小于给定的α(显著性水平:犯一类错误的概率、错误拒绝原假设的最大概率),则拒绝原假设,否则接受。而且p越小,拒绝的信心越大。

(2)false positive rate: 使用α来表示大小

(3)多重检验

http://www.bbioo.com/lifesciences/40-114656-1.html(not read yet)

在进行多重假设检验时,每个单独的假设都具有其本身的I型错误。在这种情况下,如果不进行任何的控制,犯I-型错误的概率会随着假设检验的个数而迅速增加。
 1. 多重假设检验中,广泛使用的错误控制指标是总体错误率(family-wise error rate,FWER),即至少出现一次错误地拒绝真实H0的可能性;FWER小于等于alpha。而研究者更关心的是能否尽量多地识别出差异表达的基因,并且能够容忍和允许总的拒绝中发生少量的错误识别,称为错误发现false discovery。即需要在错误发现和总的拒绝次数R之间寻找一种平衡,即在检验出尽可能多的候选变量的同时将错误发现率控制在一个可以接受的范围。
 2. 错误发现率(False Discovery Rate,FDR),表示了在所有R次拒绝中错误发现的期望比例。错误发现率和假阳性率之间有着本质的差别。错误发现率将范围限定在总的拒绝次数中;而假阳性率则针对所有变量数而言。
 3. 给定FDR的控制水平alpha,多重假设检验次数M,通过求得拒绝H0的次数N,可得出多重检验M次中,有多少次是被错误识别的(=alpha * N)。Benjamini和Hochberg给出了一个基于p-value的逐步向下控制程序,用于求出拒绝H0的次数N的值。并且证明在BH控制下,FDR 小于等于 alpha。

概率统计&假设检验-1