您好,登錄后才能下訂單哦!
小編給大家分享一下HBase中數據模型有哪些,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
HBase以表的形式存儲數據。表由行和列族組成。列劃分為若干個列族(row family),其邏輯視圖如下:
下面分別說說幾個關鍵概念:
1)行鍵(RowKey)
-- 行鍵是字節數組, 任何字符串都可以作為行鍵;
-- 表中的行根據行鍵進行排序,數據按照Row key的字節序(byte order)排序存儲;
-- 所有對表的訪問都要通過行鍵 (單個RowKey訪問,或RowKey范圍訪問,或全表掃描)
2)列族(ColumnFamily)
-- CF必須在表定義時給出
-- 每個CF可以有一個或多個列成員(ColumnQualifier),列成員不需要在表定義時給出,新的列族成員可以隨后按需、動態加入
-- 數據按CF分開存儲,HBase所謂的列式存儲就是根據CF分開存儲(每個CF對應一個Store),這種設計非常適合于數據分析的情形
3)時間戳(TimeStamp)
-- 每個Cell可能又多個版本,它們之間用時間戳區分
4)單元格(Cell)
-- Cell 由行鍵,列族:限定符,時間戳唯一決定
-- Cell中的數據是沒有類型的,全部以字節碼形式存貯
5)區域(Region)
-- HBase自動把表水平(按Row)劃分成多個區域(region),每個region會保存一個表里面某段連續的數據;
-- 每個表一開始只有一個region,隨著數據不斷插入表,region不斷增大,當增大到一個閥值的時候,region就會等分會兩個新的region;
-- 當table中的行不斷增多,就會有越來越多的region。這樣一張完整的表被保存在多個Region 上。
-- HRegion是HBase中分布式存儲和負載均衡的最小單元。最小單元表示不同的HRegion可以分布在不同的HRegionServer上。但一個HRegion不會拆分到多個server上。
以上是“HBase中數據模型有哪些”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。