用 RAxML 构建极大似然进化树
RAxML 是用极大似然法建立进化树的软件之一,可以处理超大规模的序列数据,包括
上千至上万个物种,几百至上万个已经比对好的碱基序列。作者是德国慕尼黑大学的 A.
Stamatak博士。
RAxML 有若干版本(有的版本支持在多个 CPU 上运行),本文以最常用的单机版
raxmlHPC 为例。
1 下载和安装
RAxML可以在 Linux, MacOS, DOS下运行,下载网址为
http://icwww.epfl.ch/~stamatak/index-Dateien/Page443.htm
也可以使用 www.phylo.com 的超级计算机运行。
对于 Linux和 Mac 用户
下载 RAxML-7.0.4.tar.gz 用gcc 编译即可
make –f Makefile.gcc
Windows 用户可以下载编译好的 exe 文件,而无需安装。
2 数据的输入
RAxML 的数据位 PHYLIP 格式,但是其名字可以增加至 256 个字符。“RAxML 对
PHYLIP文件中的 tabs,inset 不敏感”。输入的树的格式为 Newick
RAxML 的查错功能
1 序列的名称有重复,即不同的碱基却拥有一致的名称。
2 序列的内容重复,即两条不同名称的序列,碱基完全一致。
3 某个位点完全由序列完全由未知符号组成,如氨基酸序列完全由 X,?,*,-组成,DNA 序列
完全由 N,O,X,?,-组成。
4 序列完全由未知符号组成,如氨基酸序列完全由 X,?,*,-组成,DNA 序列完全由 N,O,X,?,-
组成。
5 序列名称中禁用的字符 如包括空格、制表符、换行符、:,(),[]等
3 RAxMLHPC 下的选项
-s sequenceFileName 要处理的 phy 文件
-n outputFileName 输出的文件
-m substitutionModel 模型设定
方括号中的为可选项:
[-a weightFileName] 设定每个位点的权重,必须在同一文件夹中给出相应位点的权重
评论1
最新资源