您好,登錄后才能下訂單哦!
本篇內容主要講解“如何使用GetOrganelle軟件組裝葉綠體基因組”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“如何使用GetOrganelle軟件組裝葉綠體基因組”吧!
現在做植物的葉綠體基因組基本上都是直接以新鮮葉片做材料,提取總DNA測序,構建二代測序文庫,然后利用現成的軟件組裝葉綠體基因組,省去了提取葉綠體的步驟
利用總DNA測序的數據組裝葉綠體基因組的軟件很多,有一篇綜述介紹這些工具
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02153-6
今天這篇推文我使用 GetOrganelle 這個軟件,軟件的Github鏈接 https://github.com/Kinggerm/GetOrganelle
對應的論文
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-020-02154-5
軟件的github主頁對軟件的使用方法介紹的很詳細,這款軟件是昆明植物所的老師開發的,還開設了qq群進行答疑,qq群號在gitbub的主頁末尾可以看到
安裝直接使用conda,非常容易
conda install -c bioconda getorganelle
想要在linux系統下使用conda命令需要安裝miniconda或者Anaconda3,我之前錄制過一期視頻介紹linux系統安裝 Anaconda3,不熟悉的可以找來看看 https://www.bilibili.com/video/BV1Ft4y1e7w2
軟件安裝好以后還得下載參考基因組,運行如下命令
組裝用到的命令是get_organelle_from_reads.py
,使用到的參數有
-1 -2 分別制定雙端測序數據的路徑
-o 制定輸出文件的文件名
-R -k 具體是什么意思我還不知道,-R按照幫助文檔直接設置15應該就可以,-k后面接的數字也可以按照他幫助文檔的來設置,現在雙端測序通常是150bp,這個-k參數直接設置105和121就可以,這個數字少一點,速度應該會快一點。
-F 指定參考,如果是葉綠體基因組后面直接跟 embplant_pt 就可以
因為葉綠體基因組的拷貝數高,基本上2G的數據量就夠組裝得到完整基因組用的了。所以直接用head命令取全基因組測序數據的前2千萬行就夠了
head -n 20000000 data_R1.fastq > R1.fastq
head -n 20000000 data_R2.fastq > R2.fastq
最后是組裝
get_organelle_from_reads.py -1 R1.fastq -2 R2.fq -o plastome_output -R 15 -k 105,121 -F embplant_pt
如果組裝成功最后會得到兩條序列,這兩條序列差別在小單拷貝區方向不同,我自己的處理方式是選一些近緣的參考葉綠體基因組來構建進化樹,去掉枝長明顯過長的那一個。
到此,相信大家對“如何使用GetOrganelle軟件組裝葉綠體基因組”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。