91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

edgeR的TMM歸一化算法怎么使用

發布時間:2021-12-18 15:02:55 來源:億速云 閱讀:478 作者:iii 欄目:大數據

本篇內容主要講解“edgeR的TMM歸一化算法怎么使用”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“edgeR的TMM歸一化算法怎么使用”吧!

我們都知道raw count的定量方式,是無法直接在樣本間進行比較的。所以差異分析時,都會對原始的表達量數據進行歸一化。

造成raw count無法直接比較的因素有很多,最常見的有以下兩個因素
1.測序量
2.RNA的組成

測序量對count的影響很好理解,測序的數據量越大,對應的reads也就越多。RNA的組成是如何影響表達量的呢?

由于RNA的組織特異性,時間特異性等因素,我們無法保證兩個樣本中表達的RNA的種類和數量完全相同。假設兩個樣本A和B, B中的RNA的種類是A的兩倍,共有的RNA表達量相同,在相同測序量的情況下,共有的RNA在A中的表達量會是B中的兩倍,由此可見,不同樣本RNA的構成也會對檢測到的RNA表達量造成影響。

歸一化時,通常的做法是只考慮樣本間相同的RNA, 在此基礎上,再消除測序量的影響。

DESeq2的歸一化算法只考慮在所有樣本中表達量都大于零的基因,也是出于相同RNA構成的考慮。edgeR采取了參照樣本的策略,首先從所有樣本中挑選一個樣本作為參照,在對其他樣本進行歸一化時,只考慮哪些在參照樣本和待歸一化的樣本間共有的RNA。

選取參照樣本的代碼如下

y   <- t(t(data)/lib.size)
f75 <- apply(y,2,function(x) quantile(x,p=p0.75))
refColumn <- which.min(abs(f75-mean(f75)))

根據相對豐度,計算每個樣本的第三四分位數,采用該值代表每個樣本的表達
水平,選取與所有樣本第三四分位數均值相差最小的樣本作為參照樣本。

參照樣本選好之后,采用循環對每個樣本進行歸一化。在歸一化時,重點關注基因的選取。代碼如下

obs <- as.numeric(obs)
ref <- as.numeric(ref)
nO <- sum(obs)
nR <- sum(ref)
logR <- log2((obs/nO)/(ref/nR))    
absE <- (log2(obs/nO) + log2(ref/nR))/2
v <- (nO-obs)/nO/obs + (nR-ref)/nR/ref
fin <- is.finite(logR) & is.finite(absE) & (absE > -1e10)
logR <- logR[fin]
absE <- absE[fin]
v <- v[fin]

ref代表參照樣本的表達量,obs代表待歸一化樣本的表達量。通過構建的3個統計量對基因進行初步過濾,logR 其實就是樣本間的log2FD值,absE是表達量的均值,通過fin指定的過濾措施,過濾掉在任意樣本中表達量為的基因,通過absE過濾掉一部分表達量很低的基因。

在此基礎上,分別從頭尾再去除部分基因,代碼如下

n <- length(logR)
loL <- floor(n * 0.3) + 1
hiL <- n + 1 - loL
loS <- floor(n * 0.05) + 1
hiS <- n + 1 - loS
keep <- (rank(logR)>=loL & rank(logR)<=hiL) & (rank(absE)>=loS & rank(absE)<=hiS)

這樣做的目的是保留在樣本間表達量沒有差異的基因。最后在利用下列公式計算每個樣本的sizefactor

f <- sum(logR[keep]/v[keep], na.rm=TRUE) / sum(1/v[keep], na.rm=TRUE)
2^f

相比DESeq2的歸一化算法,TMM算法基于表達量沒有差異的基因來進行歸一化。

到此,相信大家對“edgeR的TMM歸一化算法怎么使用”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

余姚市| 尼木县| 四子王旗| 砚山县| 东城区| 班玛县| 军事| 扶风县| 衡山县| 咸丰县| 武宁县| 新乐市| 延长县| 新密市| 津南区| 色达县| 铜鼓县| 盐池县| 苍梧县| 乌鲁木齐县| 祁东县| 前郭尔| 凉城县| 樟树市| 许昌市| 滨州市| 慈利县| 昌乐县| 仁寿县| 大足县| 龙州县| 安福县| 太和县| 徐汇区| 精河县| 太白县| 信宜市| 金坛市| 乌苏市| 冷水江市| 新郑市|