R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據

發布時間：2022-07-04 10:11:11 來源：億速云閱讀：247 作者：iii 欄目：開發技術

這篇文章主要介紹“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”的相關知識，小編通過實際案例向大家展示操作過程，操作方法簡單快捷，實用性強，希望這篇“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”文章能幫助大家解決問題。

前言

h6只是一種簡單的數據組織格式【層級數據存儲格式(HierarchicalDataFormat：HDF)】，該格式被設計用以存儲和組織大量數據。

在一些單細胞文獻中，作者通常會將分析的數據上傳到GEO數據庫保存為.h6格式文件，而不是我們常見的工程文件(rds文件，表格數據等)，所以為了解析利用這些數據需要對hdf5格式的組織結構有一定的了解。

（注：在Seurat包中有現成的函數Seurat::Read10X_h6()可以用來提取表達矩陣，但似乎此外無法從h6文件中提取更多的信息）。

GEO數據庫

R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據

在R語言中對HDF5進行操作的軟件包為rhdf5。

安裝

install.packages("BiocManager");BiocManager::install("rhdf5");library(rhdf5)

打開.h6文件和展示內容的組織結構

h6_file= H5Fopen("new.h6")
####如下所示，new.h6文件內創建了一個組（group1_mat）
#組內又創建了df和matrix兩個層級用以保存矩陣和數據框
> h6dump(h6_file,load=FALSE)
$group1_mat
$group1_mat$df
  group name       otype   dclass dim
1     /   df H5I_DATASET COMPOUND   5

$group1_mat$matrix
  group   name       otype dclass   dim
1     / matrix H5I_DATASET  FLOAT 3 x 2

數據索引通過“$”符進行

> h6_file$group1_mat$df
  C_1 C_2 C_3 name
1   3   5  69   xx
2   2   8  60   yy
3   8   4  92   gg
4   1   6  16   ll
5   7   4  25   mm

關閉hdf5文件

H5Fclose(h6_file)#關閉當前打開的hdf5文件
h6closeAll()#關閉所有打開的hdf5文件

構建自己的hdf5文件

###準備數據
mdat <- matrix(c(0,2,3, 11,12,13), nrow = 2, ncol = 3, byrow = TRUE,dimnames = list(c("row1", "row2"),c("C.1", "C.2", "C.3")))
df <- data.frame(C_1 = c(3,2,8,1,7),C_2 = c(5,8,4,6,4),C_3 = round(runif(n = 5), 2) * 100,name = c("xx","yy","gg",'ll','mm'))
mdat.spar <- Matrix::Matrix(mdat, sparse = TRUE)
my_array <- array(seq(0.1,2.0,by=0.1),dim=c(5,2,2))
my_list <- list(my_array[,,1],my_array[,,2])
my_string <- "This is one hdf structure file"
###構建.h6文件
h6createFile("new.h6")
# Saving matrix information.
h6createGroup("new.h6","group1_mat")
h6write(mdat, "new.h6", "group1_mat/matrix")
h6write(df, "new.h6", "group1_mat/df")
# Saving sparse_matrix information.
mdat.spar <- as(mdat, "dgCMatrix")
h6createGroup("new.h6","group2_sparseMTX")
h6write(mdat.spar@x, "new.h6", "group2_sparseMTX/data")
h6write(dim(mdat.spar), "new.h6", "group2_sparseMTX/shape")
h6write(mdat.spar@i, "new.h6", "group2_sparseMTX/indices") # already zero-indexed.
h6write(mdat.spar@p, "new.h6", "group2_sparseMTX/indptr")
# Saving array and list data
h6createGroup("new.h6","group3_aL")
h6write(my_list, "new.h6", "group3_aL/list")
h6write(my_array, "new.h6", "group3_aL/array")
# Saving string data
h6createGroup("new.h6","group4_string")
h6write(my_string, "new.h6", "group4_string/string")
h6closeAll()

關于“R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業相關的知識，可以關注億速云行業資訊頻道，小編每天都會為大家更新不同的知識點。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據

前言

GEO數據庫

安裝

打開.h6文件和展示內容的組織結構

數據索引通過“$”符進行

關閉hdf5文件

構建自己的hdf5文件

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

R語言rhdf5怎么讀寫hdf5并展示文件組織結構和索引數據

前言

GEO數據庫

安裝

打開.h6文件 和 展示內容的組織結構

數據索引通過“$”符進行

關閉hdf5文件

構建自己的hdf5文件

猜你喜歡

最新資訊

相關推薦

相關標簽

打開.h6文件和展示內容的組織結構