您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關illumina的DNA甲基化芯片探針的P值該如何計算,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
illumina 的DNA甲基化芯片,內置了control 探針,用于檢測降噪,歸一化等各種用途。
以450K 為例, control 探針共有以下15種類型,每種類型的探針都有不同的用途
> unique(IlluminaHumanMethylation450kmanifest@data$TypeControl[[2]]) [1] "STAINING" "EXTENSION" [3] "HYBRIDIZATION" "TARGET REMOVAL" [5] "BISULFITE CONVERSION I" "BISULFITE CONVERSION II"[7] "SPECIFICITY I" "SPECIFICITY II" [9] "NON-POLYMORPHIC" "NEGATIVE" [11] "RESTORATION" "NORM_A" [13] "NORM_G" "NORM_C" [15] "NORM_T"
在這些control探針中, NEGATIVE
探針用于計算探針的P值。
minfi
中計算探針P值的過程如下:
探針的P值 = 1 - P(intensity)
假設探針的信號強度服從正態分布,首先要計算出該正態分布的期望和方差。
由于I 型探針和II 型探針的技術原理不同,所以兩種探針是分開計算的。
首先根據negative 探針的信號強度,分別計算紅綠兩種通道的均值和方差
# 獲取negative 探針的IDcontrolIdx <- getControlAddress(rgSet, controlType = "NEGATIVE") # 計算紅色熒光通道的均值和標準差r <- getRed(rgSet) rBg <- r[controlIdx,,drop=FALSE] rMu <- matrixStats::colMedians(rBg) rSd <- matrixStats::colMads(rBg)# 計算綠色熒光通道的均值和標準差g <- getGreen(rgSet) gBg <- g[controlIdx,,drop=FALSE] gMu <- matrixStats::colMedians(gBg) gSd <- matrixStats::colMads(gBg)# 這里用了中位數代替了算數平均值
I 型探針發出的是單色熒光,可能是紅色也可能是綠色,所以紅色和綠色也是單獨計算的。
對于紅色熒光的I 型探針而言,其正態分布的均值等于negative 探針紅色熒光通道的均值,標準差對應negative 紅色熒光通道的方差
TypeI.Red <- getProbeInfo(rgSet, type = "I-Red") intensity <- r[TypeI.Red$AddressA, i] + r[TypeI.Red$AddressB, i] detP[TypeI.Red$Name, i] <- 1-pnorm(intensity, mean=rMu[i]*2, sd=rSd[i]*2)
對于綠色熒光的I 型探針而言,其正態分布的均值對應negative 綠熒光通道的均值,標準差對應negative 綠色熒光通道的方差
TypeI.Green <- getProbeInfo(rgSet, type = "I-Green") intensity <- g[TypeI.Green$AddressA, i] + g[TypeI.Green$AddressB, i] detP[TypeI.Green$Name, i] <- 1-pnorm(intensity, mean=gMu[i]*2, sd=gSd[i]*2)
II 型探針是雙色熒光,其正態分布的均值對應negative探針紅色熒光和綠色熒光的中位數之和,標準差對應紅色熒光和綠色熒光的標準差之和
TypeII <- getProbeInfo(rgSet, type = "II") intensity <- r[TypeII$AddressA, i] + g[TypeII$AddressA, i] detP[TypeII$Name, i] <- 1-pnorm(intensity, mean=rMu[i]+gMu[i], sd=rSd[i]+gSd[i])
NEGATIVE
探針是一系列質量差的探針信號,假設其分布是一個正態分布。
在某個樣本中,某個探針檢測到的信號強度為 intensity,這個intensity 可能是一個質量差的信號,也可能是一個質量高的信號。
該探針檢測到的信號質量可靠記為事件A, 質量不可靠記為事件B, 很顯然 P(A)+ P(B) = 1。
探針的P值代表這個探針的信號質量可靠的概率,所以在計算時,只需要用1減去不可靠的概率就行了。
在計算不可靠的概率時,由于I型探針和II 型探針的技術原理,共分成3個正態分布來計算概率。以上就是minfi
計算探針P值的詳細過程。
計算出探針的P值之后,就可以根據p值進行過濾了。從計算過程也可以看出,P值越小,探針質量越高。
上述就是小編為大家分享的illumina的DNA甲基化芯片探針的P值該如何計算了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。