适用于基因组规模的多序列比对工具kalign是怎样的
适用于基因组规模的多序列比对工具kalign是怎样的,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
之前提到的clustalo, muscle, mafft 适用于几千到几万条序列的多序列比对,在比较基因组学的分析中,需要对不同基因组的序列进行多序列比对。对于基因组规模的多序列比对而言,之前的工具运行速度上就不够理想了。
kalign 是一款针对大规模序列的多序列比对工具,无论是运行速度,还是比对的准确度,都令人满意。
在对应的文献中,利用测试数据集,评估了不同软件的运行速度和多序列比对的准确度,结果如下
从速度上看,Kalign遥遥领先,从准确到上看,kalign和muscle, mafft 的准确度非常接近。
kalign支持核酸和蛋白质的多序列比对,软件的安装过程如下
wgethttp://msa.sbc.su.se/downloads/kalign/current.tar.gztarxzvfcurrent.tar.gz./configuremake
编译好的可执行文件的名字为kalign
, 基本用法如下
kaligninput.fa>out.fa
默认输出fasta格式的多序列比对结果,也支持clustalw, msf 等格式。
看完上述内容,你们掌握适用于基因组规模的多序列比对工具kalign是怎样的的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注恰卡编程网行业资讯频道,感谢各位的阅读!