91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

WGCNA如何從module中挖掘關鍵基因

發布時間:2021-12-21 15:27:02 來源:億速云 閱讀:257 作者:柒染 欄目:大數據

本篇文章為大家展示了WGCNA如何從module中挖掘關鍵基因,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

識別到與表型數據相關的modules之后,還可以在該modules中進一步篩選基因,為了方便篩選,對于每個基因定義了以下三個統計量

1.  connectivity

連接度,在之前的文章中,簡單提過這個概念,類似于網絡中節點的degree的概念,只不過在加權共表達網絡中,由于每條邊代表兩個基因間的相關性的大小,對應一個數值,所以一個基因在共表達網絡中的連接度定義為與該基因相連的所有邊的數值之和。

另外,根據相連的基因是否和該基因位于同一個module, 又可以將邊分為兩類,和該基因位于同一個module內,定義為within, 位于不同的modules, 定義為out。在WGCNA中,可以通過intramodularConnectivity函數計算連接度,用法如下

# 計算基因間的鄰接值
ADJ1=abs(cor(datExpr,use="p"))^6

#計算連接度
Alldegrees1=intramodularConnectivity(ADJ1, colorh2)

計算的結果如下

> head(Alldegrees1)
kTotal kWithin kOut kDiff
Gene1 31.80186 28.37595 3.425906 24.95005
Gene2 28.88249 26.47896 2.403522 24.07544
Gene3 25.38600 23.11852 2.267486 20.85103

KTotal代表該基因的所有邊的連接度,KWithin代表和該基因位于同一個module下的邊的連接度,KOut代表和該基因位于不同module下的邊的連接度,所以KTotalKWithinKOut之和,KDiff代表KWithinKOut的差值。

在module中,會存在hub gene的概念,所謂的hub gene, 就是該module下連接度最大的基因,注意此時只考慮位于該module下的邊,就是上文的KWithin

2. module member-ship

簡稱MM, 將該基因的表達量與module的第一主成分,即module eigengene進行相關性分析就可以得到MM值,所以MM值本質上是一個相關系數,如果基因和某個module的MM值為0,說明二者根本不相關,該基因不屬于這個module; 如果MM的絕對值接近1,說明基因與該module相關性很高。

在WGCNA中,計算基因與module之間的MM值的代碼如下

datKME = signedKME(
datExpr,
datME,
outputColumnName="MM.")

第一個參數為基因表達量,第二個參數為Module Eigengene值,結果如下

> head(datKME)
MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow
Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170
Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483
Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211
Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603
Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067
Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
3. gene signigicancer

簡稱GS, 將該基因的表達量與對應的表型數值進行相關性分析,最終的相關系數的值就是GS, GS反映出基因表達量與表型數據的相關性,計算GS的代碼如下

GS1=as.numeric(cor(y,datExpr, use="p"))

通過以上三個量化指標,可以方便對module下的基因進行篩選。通常情況下,通過module和表型數據的相關性分析,我們可以篩選得到和感興趣的某一表型相關的具體的modules,在該module下面深入挖掘基因時,可以通過MMGS兩個指標作為過濾手段,示例如下

FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8

假設brown是我們找到的和表型高度相關的module, 其中的關鍵基因可以定義為和brown這一表型的GS值大于0.2,而且MM值大于0.8的基因。篩選出關鍵基因后,可以通過功能富集分析進一步挖掘其功能。

上述內容就是WGCNA如何從module中挖掘關鍵基因,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

进贤县| 荣昌县| 桦甸市| 怀化市| 东源县| 龙川县| 大余县| 新平| 大新县| 宝清县| 秀山| 进贤县| 涪陵区| 黄骅市| 鄱阳县| 施甸县| 河曲县| 东至县| 巧家县| 佛坪县| 白水县| 呈贡县| 同心县| 永清县| 哈密市| 哈巴河县| 赤城县| 嵊州市| 洪泽县| 香河县| 雅江县| 沂南县| 林西县| 奇台县| 鄢陵县| 星子县| 皮山县| 济源市| 玉龙| 泰顺县| 察隅县|