您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關Redis中Cluster分區的實現原理是什么,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
Redis Cluster本身提供了自動將數據分散到Redis Cluster不同節點的能力,分區實現的關鍵點問題包括:如何將數據自動地打散到不同的節點,使得不同節點的存儲數據相對均勻;如何保證客戶端能夠訪問到正確的節點和數據;如何保證重新分片的過程中不影響正常服務。這篇文章通過了解這些問題來認識Redis Cluster分區實現原理。
Redis Cluster是由多個同時服務于一個數據集合的Redis實例組成的整體,對于用戶來說,用戶只關注這個數據集合,而整個數據集合的某個數據子集存儲在哪個節點對于用戶來說是透明的。Redis Cluster具有分布式系統的特點,也具有分布式系統如何實現高可用性與數據一致性的難點,由多個Redis實例組成的Redis Cluster結構通常如下:
Redis Cluster
Redis Cluster特點如下:
所有的節點相互連接;
集群消息通信通過集群總線通信,,集群總線端口大小為客戶端服務端口+10000,這個10000是固定值;
節點與節點之間通過二進制協議進行通信;
客戶端和集群節點之間通信和通常一樣,通過文本協議進行;
集群節點不會代理查詢;
Redis Cluster中有一個16384長度的槽的概念,他們的編號為0、1、2、3……16382、16383。這個槽是一個虛擬的槽,并不是真正存在的。正常工作的時候,Redis Cluster中的每個Master節點都會負責一部分的槽,當有某個key被映射到某個Master負責的槽,那么這個Master負責為這個key提供服務,至于哪個Master節點負責哪個槽,這是可以由用戶指定的,也可以在初始化的時候自動生成(redis-trib.rb腳本)。這里值得一提的是,在Redis Cluster中,只有Master才擁有槽的所有權,如果是某個Master的slave,這個slave只負責槽的使用,但是沒有所有權。Redis Cluster怎么知道哪些槽是由哪些節點負責的呢?某個Master又怎么知道某個槽自己是不是擁有呢?
Master節點維護著一個16384/8字節的位序列,Master節點用bit來標識對于某個槽自己是否擁有。比如對于編號為1的槽,Master只要判斷序列的第二位(索引從0開始)是不是為1即可。
位序列
如上面的序列,表示當前Master擁有編號為1,134的槽。集群同時還維護著槽到集群節點的映射,是由長度為16384類型為節點的數組實現的,槽編號為數組的下標,數組內容為集群節點,這樣就可以很快地通過槽編號找到負責這個槽的節點。位序列這個結構很精巧,即不浪費存儲空間,操作起來又很便捷。
這里講的是Redis Cluster如何將鍵空間分布在不同的節點的,鍵空間意為Redis Cluster所擁有用戶所有數據集合的鍵的取值范圍,這個范圍叫做鍵空間。提到空間分布,必然會想到哈希算法,沒錯,通過哈希算法再加上取模運算可以將一個值固定地映射到某個區間,在這里,這個區間叫做slots,區間由連續的slot組成。在Redis Cluster中,我們擁有16384個slot,這個數是固定的,我們存儲在Redis Cluster中的所有的鍵都會被映射到這些slot中,下面講講Redis Cluster是如何做映射的。
鍵到slot的基本映射算法如下:
HASH_SLOT = CRC16(key) mod 16384
用Redis中的代碼表示如下(這個代碼被稍微修改了一下,后面會還原):
crc16(key) & 0x3FFF
經過簡單的計算就得到了當前key應該是存儲在哪個slot里面,值得注意的是,指定的key會被存儲在哪個slot,這個關系是鐵打不變的。如果我提交了一批命令,往Redis中存儲一批鍵,那么這些鍵一般會被映射到不同的slot,而不同的slot又可能由Redis Cluster中不同的節點服務,這樣就和的預期有點不同,有沒有辦法將這批鍵映射到同一個slot呢?答案是可以。
鍵哈希標簽是一種可以讓用戶指定將一批鍵都能夠被存放在同一個槽中的實現方法,用戶唯一要做的就是按照既定規則生成key即可,這個規則是這樣的,如果我有對于同一個用戶有兩種不同含義的兩份數據,我只要將他們的鍵設置為下面即可:
abc{userId}def和ghi{userId}jkl
redis在計算槽編號的時候只會獲取{}之間的字符串進行槽編號計算,這樣由于上面兩個不同的鍵,{}里面的字符串是相同的,因此他們可以被計算出相同的槽,相關代碼如下:
unsigned int keyHashSlot(char *key, int keylen) {
int s, e;
for (s = 0; s < keylen; s++)
if (key[s] == '{') break;
if (s == keylen) return crc16(key,keylen) & 0x3FFF;
for (e = s+1; e < keylen; e++)
if (key[e] == '}') break;
if (e == keylen || e == s+1) return crc16(key,keylen) & 0x3FFF;
return crc16(key+s+1,e-s-1) & 0x3FFF;
}
客戶端是怎么在Redis Cluster中找到正確的節點的呢?下面看看。
文章開始講到,Redis Cluster并不會代理查詢,那么如果客戶端訪問了一個key并不存在的節點,這個節點是怎么處理的呢?比如我想獲取key為msg的值,msg計算出來的槽編號為254,當前節點正好不負責編號為254的槽,那么就會返回客戶端下面信息:
GET msg
-MOVED 254 127.0.0.1:6381
表示客戶端想要的254槽由運行在IP為127.0.0.1,端口為6381的Master實例服務。如果根據key計算得出的槽恰好由當前節點負責,則當期節點會立即返回結果。這里明確一下,沒有代理的Redis Cluster可能會導致客戶端兩次連接急群中的節點才能找到正確的服務,推薦客戶端緩存連接,這樣最壞的情況是兩次往返通信。
重新分片意為槽到集群節點的映射關系要改變,不變的是鍵到槽的映射關系,因此當重新分片的時候,如果槽中有鍵,那么鍵也是要被移動到新的節點的。下面看看重新分片是怎么做的,假如我們有一批槽需要從一個Master節點移動到另一個Master節點:
槽遷移示意圖
這里簡化模型,假設這批待遷移的槽編號為1、2、3,并假設左邊的節點為MasterA節點,右邊的節點為MasterB節點。
槽遷移的過程中有一個不穩定狀態,這個不穩定狀態會有一些規則,這些規則定義客戶端的行為,從而使得Redis Cluster不必宕機的情況下可以執行槽的遷移。下面這張圖描述了我們遷移編號為1、2、3的槽的過程中,他們在MasterA節點和Master節點中的狀態。槽1、2、3在MasterA節點中的狀態為MIGRATING,在MasterB節點中的狀態為IMPORTING。
槽遷移中間狀態
本例中MIGRATING狀態是發生在MasterA節點中的一種槽的狀態,預備遷移槽的時候槽的狀態首先會變為MIGRATING狀態,這種狀態的槽會實際產生什么影響呢?當客戶端請求的某個Key所屬的槽處于MIGRATING狀態的時候,影響有下面幾條:
如果Key存在則成功處理
如果Key不存在,則返回客戶端ASK,僅當這次請求會轉向另一個節點,并不會刷新客戶端中node的映射關系,也就是說下次該客戶端請求該Key的時候,還會選擇MasterA節點
如果Key包含多個命令,如果都存在則成功處理,如果都不存在,則返回客戶端ASK,如果一部分存在,則返回客戶端TRYAGAIN,通知客戶端稍后重試,這樣當所有的Key都遷移完畢的時候客戶端重試請求的時候回得到ASK,然后經過一次重定向就可以獲取這批鍵
本例中的IMPORTING狀態是發生在MasterB節點中的一種槽的狀態,預備將槽從MasterA節點遷移到MasterB節點的時候,槽的狀態會首先變為IMPORTING。IMPORTING狀態的槽對客戶端的行為有下面一些影響:
正常命令會被MOVED重定向,如果是ASKING命令則命令會被執行,從而Key沒有在老的節點已經被遷移到新的節點的情況可以被順利處理;
如果Key不存在則新建;
沒有ASKING的請求和正常請求一樣被MOVED,這保證客戶端node映射關
系出錯的情況下不會發生寫錯;
鍵空間遷移是指當滿足了槽遷移前提的情況下,我們就可以通過相關命令將槽1、2、3中的鍵空間從MasterA節點轉移到MasterB節點,這個過程真正實現數據轉移。相關命令:
MIGRATE
DUMP
RESTORE
DEL
以上就是Redis中Cluster分區的實現原理是什么,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。