首页 > 代码库 > Call SNP时参考序列的选择

Call SNP时参考序列的选择

1, 如果是DNA数据, 那就是选择标准的参考基因组。

2, 如果是RNA-seq数据, 能否用参考基因组的cDNA 数据呢? 答案是否定的,

因为存在着选择性剪切,所以,一个基因可能对应着多个mRNA, 那么你进行比对的时候很容易

出现一个read 比对到多个地方, 这种情况可能会导致比对结果出现误差。不利于Call SNP,

况且cDNA不一定准确,但模式生物的基因组一般都很准确,如水稻的9311(籼)和Nipponbare(粳)。

参考基因组应该选择标准的全基因组。

附水稻参考基因组下载地址

Nipponbare

ftp://ftp.jgi-psf.org/pub/compgen/phytozome/v9.0/Osativa/assembly/

http://rice.plantbiology.msu.edu/annotation_pseudo_current.shtml(下载速度极慢)

http://rapdb.dna.affrc.go.jp/download/irgsp1.html(较快)

93-11:

http://rice.genomics.org.cn/rice/link/download.jsp

参考基因组应该选择标准的全基因组。