91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何用clusterProfiler中的enricher進行富集分析

發布時間:2022-03-21 10:48:14 來源:億速云 閱讀:2387 作者:iii 欄目:開發技術

本文小編為大家詳細介紹“如何用clusterProfiler中的enricher進行富集分析”,內容詳細,步驟清晰,細節處理妥當,希望這篇“如何用clusterProfiler中的enricher進行富集分析”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。

1.問題

做基因的GO或者kegg富集分析,需要基因組當中所有基因的GO與KEGG數據庫的注釋信息,對于做模式物種的人來說很簡單,有現成的注釋結果,直接使用就可以,比如人里面可以直接用clusterProfiler進行基因集的富集分析;但是,對于非模式動物與植物的研究對象往往沒有現成的注釋結果,就沒法直接進行富集分析;

因此學會基因功能批量注釋非常重要;這里介紹一種方法可以針對所有的非模式物種進行GO和KEGG富集分析;

2.基因批量注釋

使用eggNOG對基因組進行注釋,要想進行富集分析,首先要有背景數據集的GO注釋和KEGG注釋,這里選用eggNOG進行注釋。

是在線服務器,點點鼠標上傳就能注釋,無需復雜配置。eggNOG雖然是web server,但一次最多可以注釋10萬條序列,應該是完全可以滿足需求的。將自己的基因對應的cds序列或者蛋白序列提交到該網站即可注釋。

3.GO富集分析需要準備的文件:

研究物種基因組中所有基因對應的GO文件:

go2gene.tsv  :  通過eggNOG注釋結果文件整理得到

GOGENE
CLASS
GO:0000165Pg_S3686.2
biological_process
GO:0003674Pg_S3686.2 
molecular_function
.........


go2name.tsv:GO term對應的功能描述文件

首先需要去GO下載GO的obo文件,這里我使用go-basic.obo然后我寫了個腳本可以把obo文件解析為如下格式:

http://purl.obolibrary.org/obo/go/go-basic.obo



GODESCCLASS
GO:0000001mitochondrion  inheritancebiological_process
GO:0000007low-affinity zinc ion transmembrane transporter  activitymolecular_function


4. KEGG富集分析需要的文件

ko2gene.tsv : 通過eggNOG注釋結果文件整理得到

KOGENE
ko00920Pg_S3686.2
ko01100Pg_S33386.2

ko2name.tsv   ko通路對應的名稱

KODESC 
ko00440Phosphonate and phosphinate metabolism
ko00450Selenocompound metabolism
ko00460Cyanoamino acid metabolism
ko00471D-Glutamine and D-glutamate metabolism
ko00472D-Arginine and D-ornithine metabolism
ko00473D-Alanine metabolism
ko00480Glutathione metabolism
ko00510N-Glycan biosynthesis
ko00513Various types of N-glycan biosynthesis
ko00512Mucin type O-glycan biosynthesis

5.富集分析

利用clusterProfiler中的enricher這個通用函數進行富集分析:

library(clusterProfiler)
ko2name <- read.delim('ko2name.tsv', stringsAsFactors=FALSE)
ko2gene <- read.delim('ko2gene.tsv', stringsAsFactors=FALSE)
go2name <- read.delim('gog2name.tsv', stringsAsFactors=FALSE)
go2gene <-read.delim('go2gene.tsv', stringsAsFactors=FALSE)
# 前面獲取gene list的過程略
gene_list<- read.delim('gene.tsv', stringsAsFactors=FALSE)
# GO富集
## 拆分成BP,MF,CC三個數據框
go2gene = split(go2gene , with(go2gene , CLASS))
## 以MF為例
enricher(gene_list,TERM2GENE=go2gene [['molecular_function']][c(1,2)],TERM2NAME=go2name )
# KEGG富集
enricher(gene_list,TERM2GENE=ko2name ,TERM2NAME=ko2gene )

讀到這里,這篇“如何用clusterProfiler中的enricher進行富集分析”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

乐清市| 大方县| 霸州市| 青铜峡市| 富川| 郸城县| 巴东县| 香河县| 新兴县| 海城市| 高要市| 汽车| 许昌县| 闵行区| 郁南县| 寻甸| 海伦市| 新蔡县| 老河口市| 邻水| 远安县| 彭州市| 东安县| 锦屏县| 阿拉尔市| 商都县| 邯郸市| 鹿泉市| 读书| 察雅县| 汝州市| 夏邑县| 东台市| 大同县| 横山县| 冷水江市| 青田县| 刚察县| 虞城县| 体育| 望江县|