HBase是一個分布式的、面向列的、基于Hadoop的數據庫,其數據存儲方式主要有以下幾種:
列簇(Column Family):HBase中的數據是按列簇進行存儲的,每個列簇包含多個列族(Column Family),每個列族包含多個列(Column)。列簇在創建表的時候就指定了,并且不可更改。
行鍵(Row Key):行鍵是HBase中數據的唯一標識,用于快速定位數據。行鍵是按字典序排序存儲的,可以根據行鍵的范圍或前綴進行快速檢索。
列限定符(Column Qualifier):列限定符是列的唯一標識,用于確定每個單元格的具體數據。列限定符在創建表時指定,并且可在每次插入數據時動態指定。
時間戳(Timestamp):HBase中的每個單元格可以存儲多個版本的數據,每個版本都有一個時間戳標識,可以根據時間戳獲取歷史版本的數據。
單元格(Cell):HBase中的數據以單元格的形式存儲,每個單元格由行鍵、列簇、列限定符和時間戳唯一確定。
命名空間(Namespace):HBase支持命名空間的概念,可以將表進行邏輯上的分組管理,更好地管理和組織數據。