您好,登錄后才能下訂單哦!
tabix中怎么操作VCF文件,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
安裝過程如下
wget https://sourceforge.net/projects/samtools/files/tabix/tabix-0.2.6.tar.bz2 tar xjvf tabix-0.2.6.tar.bz2 cd tabix-0.2.6/ make
下載源代碼,解壓縮之后,編譯即可。編譯成功之后,會有兩個可執行文件tabix
和bgzip
。
由于SNP位點數量巨大,對應VCF文件也非常的大,為例節省存儲空間,最常見的做法就是壓縮。bgzip
可以壓縮VCF文件,用法如下
bgzip view.vcf
壓縮之后,原本的view.vcf
文件就變成了view.vcf.gz
文件。壓縮后綴為.gz
, 如果想要解壓縮,有以下兩種用法
bgzip -d view.vcf.gz gunzip view.vcf.gz
bgzip的壓縮算法和gzip壓縮算法有著相似之處,所以對于bgzip壓縮的文件,解壓縮時除了可以使用bgzip軟件本身,還可以使用gunzip進行解壓縮。
需要注意的是,兩種算法雖然有相似之處,但是還是有本質區別的,在對VCF文件壓縮時,不可以使用gzip來代替bgzip。
對于大型的VCF文件而言,如何快速訪問其中的記錄也是個難點。tabix
可以對VCF文件構建索引,索引構建好之后,訪問速度會快很多。tabix
對VCF文件建立索引的用法如下
tabix -p vcf view.vcf.gz
注意輸入的VCF文件必須是使用bgzip
壓縮之后的VCF文件,生成的索引文件為view.vcf.gz.tbi
, 后綴為.tbi
。
構建好索引之后,可以快速的獲取指定區域的記錄,示例如下
tabix view.vcf.gz 11
tabix view.vcf.gz 11:2343545
tabix view.vcf.gz 11:2343540-2343596
關于tabix中怎么操作VCF文件問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。