您好,登錄后才能下訂單哦!
這篇文章跟大家分析一下“人類lncRNA數據庫LNCipedia如何理解”。內容詳細易懂,對“人類lncRNA數據庫LNCipedia如何理解”感興趣的朋友可以跟著小編的思路慢慢深入來閱讀一下,希望閱讀后能夠對大家有所幫助。下面跟著小編一起深入學習“人類lncRNA數據庫LNCipedia如何理解”的知識吧。
lncRNA全稱為long non-coding RNA, 長鏈非編碼RNA, 指的是長度在200nt以上的非編碼RNA。 lncRNA在細胞周期調控, 細胞分化調控,疾病的發生與發展等多種生命活動中發揮著重要作用,是研究的熱點之一。
不像起步很早的miRNA, lncRNA在最近十幾年年才逐漸興起,目前的現狀是數據庫很多,不同數據庫對于lncRNA的命名方式不統一,這種混亂的命名模式,增加了研究的難度。
LNCipedia是一個綜合性的人類lncRNA數據庫,整合了多個數據庫中,多篇文章中的lncRNA記錄,并賦予了它們統一的ID, 網址如下
https://lncipedia.org/
該數據庫中的lncRNA信息來源于以下幾個數據庫
LncRNAdb
Broad Institute
Ensembl
Gencode
Refseq
NONCODE
FANTOM
同時也包含了Nielsen
, Hangauer
等多篇文獻中發現的lncRNA信息。
對于多種來源的lncRNA, 去冗余之后賦予一個統一的ID, 對于那些已經擁有了gene symbol的lncRNA, 仍然采用gene symbol, 如果沒有的話,按照最近的蛋白編碼基因來命名,比如lnc-MYCN-1
, 代表一個在MYCN
基因附近的lncRNA, 如果多個lncRNA使用了同一個參照的蛋白編碼基因,則用數字后綴來區分不同的lncRNA基因。
對于lncRNA,根據以下原則進行了分類:
對于那些與蛋白編碼基因所在鏈相同,而且存在overlap的lncRNA, 如果與所有的exon都沒有overlap, 就歸類為intronic
, 否則歸類為sense overlapping
;
對于那些與蛋白編碼基因的反向互補區間存在overlap的lncRNA, 歸類為antisense;
對于那些與任何蛋白編碼基因都沒有交集的lncRNA, 如果在轉錄起始位點上游1000bp范圍內存在白編碼基因的轉錄起始位點,則歸類為bidirectional
, 否則歸類為intergenic
;
同時還采用了不同軟件,對蛋白編碼潛能進行了評估,軟件列表如下
CPC
HMMER
PRIDE
PhyloCSF
CPAT
Ribosome-profiling
我們可以直接從網站上下載lncRNA對應的fasta
,gtf
, bed
文件,提供了hg19
和hg38
兩種版本,示意如下
通過首頁的Search
按鈕,可以進行檢索,以LINC01725:47
為例,結果如下
這部分結果包含了lncRNA基因ID, 轉錄本iD, 染色體位置,類別,長度等信息,示意如下
給出了不同軟件預測的蛋白編碼潛能的結果,示意如下
通過lncRNA鄰近的蛋白編碼基因在不同物種間的保守性,來分析對應的lncRNA的保守性,如果一個lncRNA的參照蛋白編碼基因在其他物種中有同源,則認為對應的lncRNA在其他物種中也應該存在,結果示意如下
該網站還提供了API服務, 通過基因id或者轉錄本id來獲取對應的信息,示意如下
https://lncipedia.org/api/transcript/HOTAIR:1 https://lncipedia.org/api/gene/HOTAIR
通過這種綜合性的數據庫,可以避免不同數據庫中命名方式不同帶來的不便。
關于人類lncRNA數據庫LNCipedia如何理解就分享到這里啦,希望上述內容能夠讓大家有所提升。如果想要學習更多知識,請大家多多留意小編的更新。謝謝大家關注一下億速云網站!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。