您好,登錄后才能下訂單哦!
這篇文章主要介紹了TCGA數據下載的示例分析,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
TCGAbiolinks 下載 TCGA 數據
下載TCGA數據的方式有很多,大致可以分成3類:
1. 采用GDC 工具去下載: 這個其實挺麻煩的,下載后的數據還要合并,不同的數據合并方式還不一樣,需要些不少的代碼。
2. 從Broad 研究所的Firehose 去下載整理好的數據,但是這個數據都比較陳舊。
3. 采用R包去下載: 目前一些R包,能對GDC的工具和API進行了很好的封裝,簡化了操作過程,而且當GDC進行了升級時,R包也會及時更新,所以這種方式下載數據是一個比較理想的方式。
# 加載需要的包 library(SummarizedExperiment) library(TCGAbiolinks) ########################################################### # GDC: https://portal.gdc.cancer.gov/ ########################################################### # 設置環境參數 work_dir <- "/Users/zhangqiuxue/Lab/TCGA/TCGAbiolinks" # 設置程序參數 project <- "TCGA-STAD" data_category <- "Transcriptome Profiling" data_type <- "Gene Expression Quantification" workflow_type <- "HTSeq - Counts" legacy <- FALSE # 設置工作目錄 setwd(work_dir) # 下載基因表達量,count數格式的結果 DataDirectory <- paste0(work_dir,"/GDC/",gsub("-","_",projects)) FileNameData <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".rda") # 查詢可以下載的數據 query <- GDCquery(project = project, data.category = data_category, data.type = data_type, workflow.type = workflow_type, legacy = legacy) # 該癌癥總樣品數量 samplesDown <- getResults(query,cols=c("cases")) cat("Total sample to down:", length(samplesDown)) # TP 樣品數量 dataSmTP <- TCGAquery_SampleTypes(barcode = samplesDown, typesample = "TP") cat("Total TP samples to down:", length(dataSmTP)) # NT 樣本數量 dataSmNT <- TCGAquery_SampleTypes(barcode = samplesDown,typesample = "NT") cat("Total NT samples to down:", length(dataSmNT)) # 下載數據, 數據比較大,耐心等待 GDCdownload(query = query, directory = DataDirectory) # 保存結果,方便后面使用 data <- GDCprepare(query = query, save = TRUE, directory = DataDirectory, save.filename = FileNameData) # 表達量提取,保存到文件 data_expr <- assay(data) dim(data_expr) gene_expr_file <- paste0(DataDirectory, "_","Gene_HTSeq_Counts",".txt") write.table(data_expr, file = gene_expr_file, sep="\t", row.names =T, quote = F)
除了下載數據,TCGAbiolinks 還集成了差異分析,生存分析等功能
感謝你能夠認真閱讀完這篇文章,希望小編分享的“TCGA數據下載的示例分析”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。