您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關gencode數據庫有什么用,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
對于人和小鼠而言,NCBI, Ensembl等數據庫都保存了對應的基因注釋信息,不同數據庫中的信息來源和可信度都不一樣,gencode綜合HAVANA和Ensembl 數據庫中的信息,通過實驗手段加以驗證,從而構建一個高質量的注釋信息數據庫。網址如下
https://www.gencodegenes.org/
官網提供了GTF和GFF3兩種格式的文件以供下載,示意如下
每種類型的文件提供了3種區域
CHR
ALL
PRI
對于基因組而言,包括了chromsome
,unplaced_scaffold
, alt_scaffold
, patch
等序列,這些序列上都存在對應的基因。CHR
指的是染色體級別的信息,包括細胞核內的染色體和線粒體;ALL
包括所有的序列,PRI
只包含染色體和unplaced_scaffold序列上的信息。官方推薦,使用CHR
級別的信息。
文件中采用level
來表示注釋信息的可信度,目前共包括3個level。
level1
代表可靠的注釋信息,有直接的實驗證據支持的注釋信息;level2
代表的是經過人工校對的注釋信息,取HAVANA和Ensembl注釋信息中一致的注釋信息;level3
指的是軟件注釋的信息,通常是Ensemble中和HAVANA不一致的注釋信息。
如果想要得到更高可信度的注釋信息,可以根據level進行過濾,只選擇1和2這兩個層級的注釋信息。
文件中共包含的基因和轉錄本的個數統計如下
在文件中,會給出基因或者轉錄本的類型信息,解釋如下
protein_coding
蛋白編碼基因
lincRNA
位于基因間區的長鏈非編碼RNA
non_coding
文獻中證實的非編碼RNA
關于“gencode數據庫有什么用”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。