首页 > 代码库 > Espritz安装使用

Espritz安装使用


Espritz web地址

http://protein.bio.unipd.it/espritz/work/pid_1009562233/espritz.html


Espritz安装失败 

下载好Espritz ,输入example时报如下错误!
技术分享
好吧,人家需要的是‘GLIBC_2.14‘,先查看一下当前系统glibc的情况: 
  1. [ssw@mu01 build]$ strings /lib64/libc.so.6 |grep GLIBC
  2. GLIBC_2.2.5
  3. GLIBC_2.2.6
  4. GLIBC_2.3
  5. GLIBC_2.3.2
  6. GLIBC_2.3.3
  7. GLIBC_2.3.4
  8. GLIBC_2.4
  9. GLIBC_2.5
  10. GLIBC_PRIVATE
好吧,确实没有,安装一下。

1. glibc下载

从http://www.gnu.org/software/libc/ 下载源代码。我下载的版本是2.14,
链接地址是http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz。

2. 安装

因为glibc库使用广泛,为了避免污染当前系统环境,最好自定义安装目录,使用时定义一下环境变量就行了。具体步骤如下:
  1. [ssw@mu01 ~]$ wget http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz
  2. [ssw@mu01 ~]$ tar xvf glibc-2.14.tar.gz
  3. [ssw@mu01 ~]$ cd glibc-2.14
  4. [ssw@mu01 glibc-2.14]$ mkdir build
  5. [ssw@mu01 glibc-2.14]$ cd ./build
  6. [ssw@mu01 build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
  7. [ssw@mu01 build]$ make -j4
  8. [ssw@mu01 build]$ make install
当我们执行
  1. [ssw@mu01 build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
报如下错误。
技术分享
 GLIBC_2.14版本以上的基本上都试了一遍,都报以上错误。目前最新版本的是GLIBC_2.24
技术分享
能安装成功的只有GLIBC_2.10,但是安装GLIBC_2.10没用,软件依赖的至少是GLIBC_2.14的。 

参考:

https://my.oschina.net/zhangxu0512/blog/262275
http://ftp.gnu.org/gnu/glibc/
http://blog.sina.com.cn/s/blog_54d63a8b0100um60.html
http://blog.sina.com.cn/s/blog_75acbe0b0101596n.html

错误原因:服务器linux系统内核版本太低无法编译高版本的GLIBC_2.14

使用web端

填入E-Mail然后上传fasta序列等候邮件即可,而且web端并没有限制序列的数量。
技术分享
 
使用网页得到结果。
技术分享
 

获得数据

等一段时间,我们会收到一封邮件如下。

技术分享
 
打开连接我们可以获得6721个蛋白的disorder的5个特征。如下图。
技术分享
 

计算我们自己数据的disorder

准备文件
技术分享
yeast_gold_protein_pair.csv
技术分享
 
disorder.csv
 技术分享
 代码如下:
  1. # -*- coding: utf-8 -*-
  2. """
  3. Created on Wed Nov 16 12:46:27 2016
  4. @author: sun
  5. """
  6. import pandas as pd
  7. yeast_gold_protein_pair=pd.read_csv(‘yeast_gold_protein_pair.csv‘,usecols=[‘idA‘,‘idB‘])
  8. disorder=pd.read_csv(‘disorder.csv‘,index_col=0)
  9. #注loc通过标签选择数据,iloc通过位置选择数据
  10. idA=disorder.loc[‘sp‘ + yeast_gold_protein_pair.idA,:]
  11. idB=disorder.loc[‘sp‘ + yeast_gold_protein_pair.idB,:]
  12. idA.index=range(len(idA))
  13. idB.index=range(len(idB))
  14. data=pd.concat([yeast_gold_protein_pair,idA,idB],axis=1)
  15. data.to_csv(‘gold_protein_disorder.csv‘,index=False)
gold_protein_disorder.csv
技术分享


 


来自为知笔记(Wiz)


Espritz安装使用