您好,登錄后才能下訂單哦!
這篇文章主要介紹了GATK4是什么,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
GATK 是 Genome Analysis ToolKit 的縮寫,是一款從高通量測序數據中分析變異信息的軟件,是目前最主流的snp calling 軟件之一。GATK 設計之初是用于分析人類的全外顯子和全基因組數據,隨著不斷發展,現在也可以用于其他的物種,還支持CNV和SV變異信息的檢測。在官網上,提供了完整的分析流程,叫做GATK Best Practices。
目前最新版本文為4.1.2.0, 叫做GATK4。 和之前的版本相比,GATK4在算法上進行了優化,運行速率有所提高,而且整合了picard 軟件的功能。GATK4基于java 語言開發的,需要java 1.8 版本。下載鏈接如下
https://software.broadinstitute.org/gatk/download/
安裝過程如下:
wget https://github.com/broadinstitute/gatk/releases/download/4.1.2.0/gatk-4.1.2.0.zip
unzip gatk-4.1.2.0.zip
tree -L 1 gatk-4.1.2.0/
gatk-4.1.2.0/
├── gatk
├── gatk-completion.sh
├── gatkcondaenv.yml
├── GATKConfig.EXAMPLE.properties
├── gatkdoc
├── gatk-package-4.1.2.0-local.jar
├── gatk-package-4.1.2.0-spark.jar
├── gatkPythonPackageArchive.zip
└── README.md
解壓縮之后,可以看到兩個后綴為.jar的文件,local用于本地運行,spark用于在spark集群上運行。實際使用時,直接用gatk這個可執行文件就行了。
通過一個簡單的命令,查看程序是否正確安裝
gatk —list
這個命令能夠打印出所有的子命令,如果打印出來結果,說明程序安裝正確。部分子命令截圖如下
子命令后面如果有(picard), 說明這個功能是繼承于picard軟件,從這里也可以看出,GATK4集成了picard軟件的功能。再不需要像之前版本一樣,混合使用picard 和 gatk 了。
感謝你能夠認真閱讀完這篇文章,希望小編分享的“GATK4是什么”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。