您好,登錄后才能下訂單哦!
這篇文章主要介紹“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”的相關知識,小編通過實際案例向大家展示操作過程,操作方法簡單快捷,實用性強,希望這篇“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”文章能幫助大家解決問題。
h6只是一種簡單的數據組織格式【層級數據存儲格式(HierarchicalDataFormat:HDF)】,該格式被設計用以存儲和組織大量數據。
在一些單細胞文獻中,作者通常會將分析的數據上傳到GEO數據庫保存為.h6格式文件,而不是我們常見的工程文件(rds文件,表格數據等),所以為了解析利用這些數據需要對hdf5格式的組織結構有一定的了解。
(注:在Seurat包中有現成的函數Seurat::Read10X_h6()
可以用來提取表達矩陣,但似乎此外無法從h6文件中提取更多的信息)。
在R語言中對HDF5進行操作的軟件包為rhdf5
。
install.packages("BiocManager");BiocManager::install("rhdf5");library(rhdf5)
h6_file= H5Fopen("new.h6") ####如下所示,new.h6文件內創建了一個組(group1_mat) #組內又創建了df和matrix兩個層級用以保存矩陣和數據框 > h6dump(h6_file,load=FALSE) $group1_mat $group1_mat$df group name otype dclass dim 1 / df H5I_DATASET COMPOUND 5 $group1_mat$matrix group name otype dclass dim 1 / matrix H5I_DATASET FLOAT 3 x 2
> h6_file$group1_mat$df C_1 C_2 C_3 name 1 3 5 69 xx 2 2 8 60 yy 3 8 4 92 gg 4 1 6 16 ll 5 7 4 25 mm
H5Fclose(h6_file)#關閉當前打開的hdf5文件 h6closeAll()#關閉所有打開的hdf5文件
###準備數據 mdat <- matrix(c(0,2,3, 11,12,13), nrow = 2, ncol = 3, byrow = TRUE,dimnames = list(c("row1", "row2"),c("C.1", "C.2", "C.3"))) df <- data.frame(C_1 = c(3,2,8,1,7),C_2 = c(5,8,4,6,4),C_3 = round(runif(n = 5), 2) * 100,name = c("xx","yy","gg",'ll','mm')) mdat.spar <- Matrix::Matrix(mdat, sparse = TRUE) my_array <- array(seq(0.1,2.0,by=0.1),dim=c(5,2,2)) my_list <- list(my_array[,,1],my_array[,,2]) my_string <- "This is one hdf structure file" ###構建.h6文件 h6createFile("new.h6") # Saving matrix information. h6createGroup("new.h6","group1_mat") h6write(mdat, "new.h6", "group1_mat/matrix") h6write(df, "new.h6", "group1_mat/df") # Saving sparse_matrix information. mdat.spar <- as(mdat, "dgCMatrix") h6createGroup("new.h6","group2_sparseMTX") h6write(mdat.spar@x, "new.h6", "group2_sparseMTX/data") h6write(dim(mdat.spar), "new.h6", "group2_sparseMTX/shape") h6write(mdat.spar@i, "new.h6", "group2_sparseMTX/indices") # already zero-indexed. h6write(mdat.spar@p, "new.h6", "group2_sparseMTX/indptr") # Saving array and list data h6createGroup("new.h6","group3_aL") h6write(my_list, "new.h6", "group3_aL/list") h6write(my_array, "new.h6", "group3_aL/array") # Saving string data h6createGroup("new.h6","group4_string") h6write(my_string, "new.h6", "group4_string/string") h6closeAll()
關于“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識,可以關注億速云行業資訊頻道,小編每天都會為大家更新不同的知識點。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。