您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關Bedtools中如何進行是文件格式轉換,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
利用Bedtools進行文件格式轉換
Bedtools是由猶他大學昆蘭實驗室開發的基因組算法工具集,可以對基因組廣泛使用的數據格式如BAM、BED、GFF、VCF等進行交集、并集、計數及格式轉變等操作。想更詳細的了解Bedtools可參考官方教程:bedtools: a powerful toolset for genome arithmetic — bedtools 2.30.0 documentation。
基因組特征可以是功能元件(如基因),基因多態性(SNP、INDEL、SV)等,最基本的基因組特征是其所在的染色體、起始位置、終止位置、正負鏈特征,廣泛使用的基因組格式為BED文件及GFF文件。
Bedtools bamtobed命令將BAM文件轉換為BED文件:
$bedtools bamtobed -i test.bam
-bedpe參數,可以將BAM格式轉變為BEDPE格式,只有成對雙端的reads才會被輸出,默認的輸出格式是BED格式;
-bed12,可以輸出BED12格式,默認的輸出格式是BED6格式;
-tag,可以用BAM中其他tag當作BED score,默認的BED score值是BAM文件中的MAPQ值;
-cigar,會輸出cigar值當作BED文件的第七列。
Bedtools bedtobam命令用于將BED文件轉換成BAM文件:
$bedtools bedtobam -i test.bed -g human.hg18.genome > test.bam
-mapq,設定輸出BAM文件的mapping quality,默認的mapping quality是255;
-ubam,輸出未壓縮的BAM文件,默認輸出的是壓縮后的BAM文件。
Bedtools bamtofastq命令用于從比對的BAM文件中提取fastq文件:
$bedtools bamtofastq -i test.bam -fq test.fastq
-fq2,可以將成對的fastq文件分別輸出到兩個文件中,但輸入的BAM文件需要先對reads按名字進行排序,默認-fq輸出fastq文件。
以上就是Bedtools中如何進行是文件格式轉換,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。