您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎么理解ArrayExpress數據庫,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
和GEO數據庫類似,ArrayExpress是屬于EBI旗下的公共數據庫,用于存放芯片和高通量測序的相關數據。
數據來源于下圖所示的兩個部分
第一部分是由科研工作者提交的數據,第二部分是從GEO數據庫自動導入的數據,在該數據庫中,數據以實驗experiments為單位,每個實驗對應一個唯一的編號,如下圖所示
第一列的Accession
代表每個實驗設計對應的編號,Assays
表示該實驗對應的樣本總數,Raw
代表原始數據。當前版本數據量如下
通過該數據庫,我們可以
檢索數據,根據關鍵字,編號等查找感興趣的數據集
下載數據,基于公共數據進行分析挖掘
提交數據,上傳自己的數據到該數據庫中
點擊每個實驗編號,可以顯示詳細信息,示意如下
紅框標記的部分是通常會關注的3個部分,第一部分展示該實驗包含的樣本的詳細信息,點擊之后可以查看樣本相關的metadata, 示意如下
第二部分用于下載數據,第三部分用于將該結果導入到其他軟件,比如GenomeSpace中進行分析和查看。
除了下載和分析公共數據集,也可以上傳自己的數據到該數據庫。除了宏基因組/宏轉錄組, 轉錄組組裝的相關結果數據,其他絕大部分數據都是可以上傳到該數據庫的,比如SNP分型,基因表達譜,chip_seq, atac_seq, 甲基化測序等結果都可以。
該數據庫還配套了對應的API和R包,可以批量化,流程化地檢索和下載數據,在沒有數據的情況下,也可以基于ArrayExpress的公共數據進行深入挖掘。
以上就是怎么理解ArrayExpress數據庫,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。