首页 > 代码库 > R语言实现对基因组SNV进行注释
R语言实现对基因组SNV进行注释
很多时候,我们需要对取出的SNV进行注释,这个时候可能会在R上进行注释,通常注释文件都含有Chr(染色体)、Start(开始位点)、End(结束位点)、Description(描述),而我们的SNV文件通常是拥有Position(位置),因此我们可以先定位Chr,再用Postion去定位到Start和End之间,找到相对应的Description。为了加快速度,可以使用二分查找法。
1 fregion <- function(df, value){ 2 #df:data.frame, V1 and V2 should be Start and End value: Postition used to find region return:df row number where position locates ,if no region return -1 3 low=1 4 high=nrow(df) 5 mid=high %/% 2 6 if (df[low,1] <= value & value <= df[low,2]) low 7 else if (df[high,1] <= value & value <= df[high,2]) high 8 else{ 9 while (value > df[mid,2] || value < df[mid,1]){ 10 if (value > df[mid,2]){ 11 low = mid+1 12 } else if (value < df[mid,1]) { 13 high = mid - 1 14 } 15 if(high<low){ 16 mid=-1;break 17 } 18 mid=(low+high)%/%2 19 } 20 mid 21 } 22 }
R语言实现对基因组SNV进行注释
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。