您好,登錄后才能下訂單哦!
這篇文章主要介紹“soapdenovo2怎么安裝配置”,在日常操作中,相信很多人在soapdenovo2怎么安裝配置問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”soapdenovo2怎么安裝配置”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
soapdenovo是由華大開發的組裝工具,主要用于動植物基因組等大型基因組的組裝,也可以用于細菌/真菌基因組組裝。對于大型基因組裝而言,需要的硬件資源特別多,建議內存在150G以上。
安裝過程如下
wget https://github.com/aquaskyline/SOAPdenovo2/archive/r241.tar.gz tar xzvf r241.tar.gz cd SOAPdenovo2-r241/ make
編譯成功后,會生成如下3個可執行文件
SOAPdenovo-63mer
SOAPdenovo-127mer
SOAPdenovo-fusion
前2個可執行文件用于組裝, 63mer
代表支持的kmer最大長度為63,127mer
代表支持的kmer最大長度為127,除了支持的kmer長度不同外,其他用法完全
相同。
SOAPdenovo由以下幾個子命令構成
pregraph
sparse_pregraph
contig
map
scaff
all
前5個子命令對應了soapdenovo組裝的5個步驟,all
命令表示一次執行以上的5個步驟;在組裝時,既可以依次執行每一個步驟,也可以直接使用all
命令,一次運行所有步驟。
soapdenovo需要一個配置文件,配置文件分成兩個部分,全局配置和每個文庫的配置。全局配置目前只有一個參數max_rd_len
, 如果序列大于該長度,會被切成該長度,然后在分析。
每個文庫的配置以[LIB]
開頭,主要指定輸入文件的路徑,支持多種格式的輸入文件,用不同的前綴表示, q
代表輸入序列為fastq格式;f
代筆輸入序列為fasta格式,b
代表輸入文件為bam格式,對于雙端數據,分別用后綴1
和2
表示R1端和R2端的reads。
除了輸入文件路徑外,還包含以下幾個參數的設置
avg_ins
文庫插入片段的平均長度,在實際設置時,可以參考文庫size分布圖,取峰值即可
reverse_seq
是否需要將序列反向互補,對于pair-end數據,不需要反向互補,設置為0;對于mate-pair數據,需要反向互補,設置為1
asm_flags
1表示只組裝contig. 2表示只組裝scaffold,3表示同時組裝contig和scaffold,4表示只補gap
rd_len_cutof
序列長度閾值,作用和max_rd_len相同,大于該長度的序列會被切除到該長度
rank
設置不同文庫數據的優先級順序,取值范圍為整數,rank值相同的多個文庫,在組裝scaffold時,會同時使用。
pair_num_cutoff
contig或者scaffold之前的最小overlap個數,對于pair-end數據,默認值為3;對于mate-paird數據,默認值為5
map_len
比對長度的最小閾值,對于pair-end數據,默認值為32;對于mate-pair數據,默認值為35
配置文件示例如下
max_rd_len=100 [LIB] avg_ins=200 reverse_seq=0 asm_flags=3 rd_len_cutoff=100 rank=1 q1=fastq1_read_1.fq q2=fastq1_read_2.fq
軟件基本用法如下
SOAPdenovo-63mer all -s config_file -K 63 -R -o graph_prefix
運行成功后,會生成很多文件,其中有兩個文件是組裝的結果,后綴分別為contig
和scafSeq
,對應contig和scaffold。
到此,關于“soapdenovo2怎么安裝配置”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。