您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關sleuth基于TPM值sleuth進行的差異分析是怎樣的,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
kallisto等alignment-free轉錄本定量軟件,會給出TPM
值的定量結果。基于這種類型的結果進行差異分析時,有兩種策略可以選擇。
第一種是采用tximport
R包,將結果導入到DESeq2
種進行分析;第二種是直接采用sleuth
R包進行差異分析。本章主要介紹sleuth
的使用。
這個包的源代碼存放在github上,鏈接如下
https://github.com/pachterlab/sleuth
github上的R包其安裝方式比較特殊, 具體過程如下
source("http://bioconductor.org/biocLite.R") biocLite("rhdf5") library(devtools) install_github("pachterlab/sleuth")
首先從Bioconductor上安裝依賴的rhdf5
包,因為kallisto的定量結果為HDF5格式,這個R包用來讀取數據,然后采用devtools
這個R包,自動從github的源代碼進行安裝。
所有差異分析需要的都是定量結果和樣本分組這兩個基本元素,只不過不同的R包要求的格式不同。在sleuth
中,將這兩種信息存儲在一個三列的數據框中,示例如下
> s2c samples group paths 1 control-1 control kallisto/control-1 2 control-2 control kallisto/control-2 3 control-3 control kallisto/control-3 4 case-1 case kallisto/case-1 5 case-2 case kallisto/case-2 6 case-3 case kallisto/case-3
第一列為樣本名稱,第二列為樣本對應的分組信息,第三列為每個樣本kallisto定量結果的文件夾。通過這樣的一個數據框,就包含了差異分析所需的所有信息。
假定有6個樣本,分成control,case 兩組, 每組3個生物學重復,可以通過以下代碼構建上述的數據框
samples = c( "control-1", "control-2", "control-3", "case-1", "case-2", "case-3") s2c <- data.frame( samples = samples, group = rep(c("control", "case"), each = 3), paths = paste("kallisto", samples, sep = "/") )
上述代碼要求將所有樣本的定量結果放在同一個文件夾下,目錄結構如下
kallisto/ ├── control-1 ├── control-2 ├── control-3 ├── case-1 ├── case-2 └── case-3
上述數據框準備好之后,就可以讀取數據進行差異分析了,完整的代碼如下
library(sleuth) so <- sleuth_prep(s2c, extra_bootstrap_summary = TRUE) so <- sleuth_fit(so, ~condition, 'full') so <- sleuth_fit(so, ~1, 'reduced') so <- sleuth_lrt(so, 'reduced', 'full') sleuth_table <- sleuth_results(so, 'reduced:full', 'lrt', show_all = FALSE)
上述就是小編為大家分享的sleuth基于TPM值sleuth進行的差異分析是怎樣的了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。