91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

fasta索引文件、序列提取的示例分析

發布時間:2022-02-23 11:55:25 來源:億速云 閱讀:698 作者:小新 欄目:開發技術

這篇文章主要介紹了fasta索引文件、序列提取的示例分析,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

fasta是常用的序列存儲格式,很多軟件(如GATK、IGV等)在導入序列以及進行快速查找時通常需要建立索引文件。下面就來介紹如何使用 samtools 便捷的建立fasta文件的索引以及快速進行序列提取。

建立索引

建立索引只需在Linux下輸入命令:samtools faidx input.fa

這里序列文件為 input.fa,生成的索引文件以 .fai 結尾。需要注意的是,輸入的fasta文件的每條序列除最后一行外,其余行的長度必須相同,否則會報錯哦!最后生成的.fai文件如下, 共5列,以制表符分隔;

第一列 NAME : 序列的名稱,只保留“>”后,第一個空白之前的內容;

第二列 LENGTH : 序列的長度,單位為bp;

第三列 OFFSET : 第一個堿基的偏移量,從0開始計數,換行符也統計進行;

第四列 LINEBASES : 除了最后一行外, 其他代表序列的行的堿基數, 單位為bp;

第五列 LINEWIDTH : 行寬, 除了最后一行外, 其他代表序列的行的長度,包括換行符,在windows系統中換行符為\r\n,要在序列長度的基礎上加2。

提取序列

除建立索引外,還可以利用samtools方便的提取序列,例如:

samtools faidx input.fa chr2 > chr2.fa,會得到含chr2這條序列的fasta格式的文件,如果是多條序列,只需在文件后羅列需提取的序列ID即可,使用空格分隔,如 samtools faidx input.fa chr1 chr2 chr3 > chr.fa。

再如:samtools faidx input.fa chr2:1-1000 > chr2.fa,能得到chr2序列的第1到第1000個堿基的fasta格式的文件,同樣可以提取多條序列。

samtools 安裝

1. 下載,地址如下:http://www.htslib.org/doc/samtools.html。

2. 安裝,使用命令tar -jxvf samtools-1.6.tar.bz2解壓下載的壓縮包,最后使用make命令就可以了。

感謝你能夠認真閱讀完這篇文章,希望小編分享的“fasta索引文件、序列提取的示例分析”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阿克苏市| 柯坪县| 肥城市| 阿克陶县| 西林县| 桐乡市| 巴楚县| 南通市| 塘沽区| 通许县| 措勤县| 东阿县| 定安县| 齐齐哈尔市| 海口市| 泾川县| 女性| 承德县| 太原市| 敖汉旗| 吴江市| 澳门| 抚宁县| 开化县| 青阳县| 长治县| 古蔺县| 长垣县| 海淀区| 通许县| 吉木萨尔县| 邳州市| 阿克苏市| 新建县| 新昌县| 金秀| 定南县| 塔城市| 新密市| 兴安县| 五家渠市|