91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

TCGA數據下載的示例分析

發布時間:2022-03-18 14:54:34 來源:億速云 閱讀:192 作者:小新 欄目:開發技術

這篇文章主要介紹了TCGA數據下載的示例分析,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

TCGAbiolinks  下載 TCGA 數據

下載TCGA數據的方式有很多,大致可以分成3類:

1. 采用GDC 工具去下載: 這個其實挺麻煩的,下載后的數據還要合并,不同的數據合并方式還不一樣,需要些不少的代碼。

2. 從Broad 研究所的Firehose 去下載整理好的數據,但是這個數據都比較陳舊。

3. 采用R包去下載: 目前一些R包,能對GDC的工具和API進行了很好的封裝,簡化了操作過程,而且當GDC進行了升級時,R包也會及時更新,所以這種方式下載數據是一個比較理想的方式。

#  加載需要的包

library(SummarizedExperiment)
library(TCGAbiolinks)

###########################################################
# GDC: https://portal.gdc.cancer.gov/
###########################################################

# 設置環境參數
work_dir <- "/Users/zhangqiuxue/Lab/TCGA/TCGAbiolinks" 

# 設置程序參數
project <- "TCGA-STAD"
data_category <- "Transcriptome Profiling"
data_type <- "Gene Expression Quantification"
workflow_type <- "HTSeq - Counts"
legacy <- FALSE


# 設置工作目錄
setwd(work_dir)

# 下載基因表達量,count數格式的結果
DataDirectory <- paste0(work_dir,"/GDC/",gsub("-","_",projects))
FileNameData <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".rda")

# 查詢可以下載的數據
query <- GDCquery(project = project,
                  data.category = data_category,
                  data.type = data_type, 
                  workflow.type = workflow_type,
                  legacy = legacy)

# 該癌癥總樣品數量
samplesDown <- getResults(query,cols=c("cases"))
cat("Total sample to down:", length(samplesDown))

# TP 樣品數量
dataSmTP <- TCGAquery_SampleTypes(barcode = samplesDown, typesample = "TP")
cat("Total TP samples to down:", length(dataSmTP))

# NT 樣本數量
dataSmNT <- TCGAquery_SampleTypes(barcode = samplesDown,typesample = "NT")
cat("Total NT samples to down:", length(dataSmNT))


# 下載數據, 數據比較大,耐心等待
GDCdownload(query = query,
            directory = DataDirectory)

# 保存結果,方便后面使用
data <- GDCprepare(query = query, 
                       save = TRUE, 
                       directory =  DataDirectory,
                       save.filename = FileNameData)

# 表達量提取,保存到文件
data_expr <- assay(data)
dim(data_expr)
gene_expr_file <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".txt")
write.table(data_expr, file = gene_expr_file, sep="\t", row.names =T, quote = F)

除了下載數據,TCGAbiolinks 還集成了差異分析,生存分析等功能

感謝你能夠認真閱讀完這篇文章,希望小編分享的“TCGA數據下載的示例分析”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

扬中市| 枣庄市| 祁连县| 沙雅县| 友谊县| 广昌县| 万全县| 黔南| 小金县| 富顺县| 贺州市| 旌德县| 昌图县| 定安县| 剑川县| 彰武县| 西贡区| 奉化市| 昆明市| 和顺县| 安乡县| 大关县| 竹北市| 平陆县| 商河县| 招远市| 隆昌县| 濉溪县| 凤台县| 北安市| 锡林浩特市| 东乌珠穆沁旗| 潜江市| 乐安县| 新建县| 阜宁县| 绥芬河市| 临汾市| 思茅市| 海林市| 绿春县|