在HBase中,數據是以表格形式存儲的,每個表由行(row)組成,每行又包含多個列族(column family),而列族包含多個列(column)。數據存儲在HBase中的形式如下:
- 表(Table):HBase中數據存儲的最頂層結構就是表。每個表由多行組成,通常根據業務需求來設計。
- 行(Row):表中的每一行由一個唯一的行鍵(row key)標識。行鍵是按字典順序排序的,可以用于快速定位和訪問特定的行。
- 列族(Column Family):每個行可以包含一個或多個列族,每個列族包含多個列。列族是邏輯上的分組,用于在物理存儲上實現高效的隨機讀寫操作。
- 列(Column):列是存儲實際數據的基本單元。每個列由列族名和列限定符(qualifier)組成,形成唯一的列標識。每個列可以存儲一個值,這些值可以是任意類型的數據。
HBase采用稀疏表格存儲模型,只存儲有值的單元格,因此可以有效地處理大規模數據,并支持高度可伸縮性和高并發訪問。