您好,登錄后才能下訂單哦!
如何理解OMIM數據庫,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
OMIM 全稱叫做Online Mendelian Inheritance in Man, 是一個不斷更新的人類孟德爾遺傳病的數據庫。這個數據庫主要關注人類基因變異和表型性狀之間的關系。
數據庫中的每一條記錄,都會有一個唯一的由6位數字組成的OMIM 編號,不同數字開頭的編號含義不同,其中:
數字1和2 開頭的,代表常染色體上的相關位點和表型(1995年之前創建的)
數字3開頭的,代表X染色體上的相關位點和表型
數字4開頭的,代表Y染色體上的相關位點和表型
數字5開頭的,代表線粒體上的相關位點和表型
數字6開頭的,代表常染色體上的相關位點和表型(1995 年之后創建的)
對于等位基因,每一條記錄都有一個唯一的MIM 編號,由點號分隔的兩部分構成,點號之前是突變位點對應的OMIM 編號,點號之后是一個由4位數字構成的唯一ID, 用來記錄等位基因。
以IX 基因為例,對應的等位基因有 300746.0001 和 300746.0101 兩個MIM 編號。
這個數據庫是不斷更新的,截止到2018年5月29號,數據庫中的數據記錄如下:
數據庫中的記錄,分成了5個類別。
這種記錄以”*”開頭,主要記錄基因的相關信息,比如100640
這種記錄以+
開頭,描述了基因和表型之間的關聯,比如100650
在網頁上,會給出基因和表型之間的關聯
這種記錄以#
開頭,描述了分子機制清楚的表型信息,比如100100
在Text
字段中,會給出詳細的和該表型相關的基因突變信息
這種記錄以%
開頭,描述了分子機制不清楚的表型信息,通常都有由多種遺傳因素控制的疾病,相關突變位點較多,比如100070
其他類型的記錄,這部分記錄之前沒有任何前綴,比如10050
目前該網站的完整數據只面向科研機構開放下載,下載頁面的鏈接如下
https://omim.org/downloads/
其中的mim2gene.txt
是大家都可以下載的,里面有數據庫所有記錄的編號。
第一列的ID就是omim編號,知道編號之后,可以快速得到對應的頁面,鏈接格式如下
https://omim.org/entry/100640
雖然不能下載到完整的數據庫,但是只需要根據編號,也可以快速得到想要的信息。如果你編程能力夠強,也可以抓取所有的網頁,構建一個本地版的數據庫。
關于如何理解OMIM數據庫問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。