您好,登錄后才能下訂單哦!
怎么使用muscle進行多序列比對,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
muscle是最為廣泛使用的多序列比對工具之一,其速度和準確度比clustal都要更加優秀,在幾秒鐘的時間就可以完成上百條序列的比對,而且用法簡單。
在下載頁面,提供了多個操作系統的可執行文件。
linux下安裝的代碼如下
wget https://www.drive5.com/muscle/downloads3.8.31/muscle3.8.31_i86linux64.tar.gz tar xzvf muscle3.8.31_i86linux64.tar.gz mv muscle3.8.31_i86linux64 muscle chmod +x muscle
由于解壓后的文件名很長,這里對文件進行了重命名,然后添加了可執行權限。為了方便調用,可以將該文件添加到PATH環境變量中。muscle的基本用法如下
muscle -in seqs.fa -out seqs.afa
輸入序列為FASTA格式,如果輸入序列中出現了gap, 會先去除這些gap, 然后在進行多序列比對。默認輸出的比對結果也為fasta格式,也支持phylip
, msf
, clustalw
等其他格式。
除了多序列比對外,muscle還可以構建進化樹,支持以下兩種建樹方式
NJ
UPGMA
NJ法構建的進化樹可信度更高,而UPGMA建樹的速度更快。基本用法如下
muscle -maketree -in seqs.afa -out seqs.phy -cluster neighborjoining
-cluster
參數指定建樹的方法,默認為upgma。輸出的tree文件格式為Newick格式。
muscle的默認參數設置最大化的保證了比對的準確度,對于大的序列,如果比對速度不是很理想時,可以適當的調整參數。
對于核酸和氨基酸序列,官方分別推薦了速度最快的參數設置。
核酸
muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags
氨基酸
muscle -in seqs.fa -out seqs.afa -maxiters 1 -diags -sv -distance1 kbit20_3
使用muscle時,其默認參數設置就能夠滿足絕大部分的使用場景,只有對于較大的輸入序列,才需要調整參數。
EBI提供了muscle的在線服務,網址如下
https://www.ebi.ac.uk/Tools/msa/muscle/
用法和clustal的用法是類似的,這里就不贅述了。對于500條以下而且數據量小于1Mb的序列,可以直接使用該在線服務。
關于怎么使用muscle進行多序列比對問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。