您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關ANNOVAR是一款什么軟件,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
ANNOVAR 是一款變異位點注釋軟件,提供了多方位的注釋功能,支持多個物種,是最受歡迎的注釋軟件之一。
支持的物種包括以下6種:
huamn
mouse
worm
fly
yeast
others
ANNOVAR 對于學術和非盈利機構而言是免費下載的,只需要注冊個賬號就可以了。下載之后,解壓縮即可。解壓縮之后的文件列表如下
├── annotate_variation.pl ├── coding_change.pl ├── convert2annovar.pl ├── example ├── humandb ├── retrieve_seq_from_fasta.pl ├── table_annovar.pl └── variants_reduction.pl
ANNOVAR
是用perl語言編寫的,由一系列的perl腳本構成。其中annotate_variation.pl
是最核心的腳本。
安裝好之后,第一步就是下載相關的數據庫,命令如下
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar refGene humandb/
-downdb
表明該命令的用途是下載數據庫,-buildver
指定基因組版本,默認為hg18
, -webform
指定下載的鏈接,默認是ucsc
, refGene
代表的是下載的數據庫的名字,humandb
表示數據庫存儲的路徑。
對于指定版本的參考基因組而言,可以通過如下命令查看其所有的數據庫
annotate_variation.pl -downdb -buildver hg19 -webfrom annovar avdblist hg19_list/
用法和第一個示例相同,只不過數據庫的名字指定為avdblist
, 下載成功后會有
一個對應的avdblist.txt
,部分內容如下
hg19_abraom.txt.gz 20180312 23198051 hg19_abraom.txt.idx.gz 20180312 9837067 hg19_AFR.sites.2012_04.txt.gz 20140106 277370590 hg19_AFR.sites.2012_04.txt.idx.gz 20140106 22362560 hg19_ALL.sites.2010_11.txt.gz 20140106 179456415 hg19_ALL.sites.2010_11.txt.idx.gz 20140106 21944132 hg19_ALL.sites.2011_05.txt.gz 20140106 232127231
每一行代表一個數據庫文件。
參考基因組相關數據庫準備好之后,就可以進行注釋了。
第一步就是準備輸入文件,輸入文件有兩種格式
ANNOVAR
自定義的格式,用空格或者制表符分隔,最少需要5列,分別代表染色體,起始位置,終止位置,參考基因組的堿基,變異之后的堿基,其他的列作為額外補充信息,示例如下
1 948921 948921 T C comments: rs15842, a SNP in 5' UTR of ISG15 1 13211293 13211294 TC - comments: rs59770105, a 2-bp deletion 1 11403596 11403596 - AT comments: rs35561142, a 2-bp insertion
VCF格式在之前的文章中介紹過了,這里不再贅述。VCF是突變分析的一種標準格式,大多數軟件都支持這種格式的輸出。
ANNOVAR
可以識別的格式就這兩種,當你有其他格式的snp calling結果時,可以使用convert2annovar.pl
進行格式轉換。比如將VCF和pileup
格式的文件轉換為annovar
的輸入格式
convert2annovar.pl -format pileup variant.pileup -outfile variant.query convert2annovar.pl -format vcf4 variantfile -outfile variant.avinput
ANNOVAR
軟件的功能可以分成以下4大類
分析變異位點對蛋白質的影響,支持多種基因集,包括RefSeq, UCSC, ENSEMBL, GENCODE 等。
分析變異位點是否位于基因組上的特殊區域,比如轉錄因子結合區域,組蛋白修飾區等。
分析變異位點是否位于指定的數據庫中,比如dbSNP, 1000G,ESP 6500等數據庫,計算SIFT
,PolyPhen
, LRT
, MutationTaster
, MutationAssessor
, FATHMM
, MetaSVM
, MetaLR
等指標。
從基因組上根據坐標提取序列等小功能。
在實際分析中,主要使用annovar
的注釋功能。可以看到,annovar
提供了3大類型的注釋。
關于“ANNOVAR是一款什么軟件”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。