您好,登錄后才能下訂單哦!
今天小編給大家分享一下MongoDB高可用與分片的知識點有哪些的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
在MongoDB中,創建副本集后就可以使用復制功能了,副本集是一組服務器,其中一個用于處理寫操作的主節點primary,還有多個用于保存主節點數據副本的從節點secondary。如果主節點崩潰了,則從節點會選取出一個新的主節點。
如果使用復制功能時有一臺服務器停止運行了,那么仍然可以從副本集中的其它服務器訪問數據。如果服務器上的數據已損壞或無法訪問,則可以從副本集中的其它成員中創建一個新的數據副本。
副本集中的每個成員都必須能夠連接到其它成員,如果收到有關成員無法訪問到其它成員,則可能需要更改網絡配置以允許它們之間的連接。
當一個從節點無法與主節點連通時,它就會聯系并請求其它的副本集成員將自己選舉為主節點。
其它成員會做幾項健全性檢查:
它們能否連接到主節點,而這個主節點是發起選舉的節點無法連接到的?
這個發起選舉的從節點是否有最新數據?
有沒有其它更高優先級的成員可以被選舉為主節點?
MongoDB在3.2版本中引入了第1版復制協議。這是一個類PAFT的協議,并且包含了一些特定于MongoDB的副本集概念,比如仲裁節點、優先級、非選舉成員、寫入關注點等。還提出了很多新概念,比如更短的故障轉移時間,大大減少了檢測主節點失效的時間,它還通過使用term ID來防止重復投票。
RAFT是一種共識算法,它被分解成了相對獨立的子問題。共識是指多臺服務器或進程在一些值上達成一致的過程。RAFT確保了一致性,使得同一序列的命令產生相同序列的結果,并在所部署的各個成員中達到相同序列的狀態。
副本集成員相互間每隔兩秒發送一次心跳。如果某個成員在10秒內沒有反饋心跳,則其它成員會將不良成員標記為無法訪問。選舉算法將盡最大努力嘗試讓具有最高優先權的從節點發起選舉。成員優先權會影響選舉的時機和結果。優先級高的從節點要比優先級低的從節點更快發起選舉,而且也更有可能成為主節點。然而,低優先級的從節點也是有可能被短暫的選舉為主節點的,副本集成員會繼續發起選舉直到可用的最高優先級成員被選舉為主節點。被選舉為主節點的從節點必須擁有最新的復制數據。
優先級用于表示一個成員稱為主節點的優先程度,取值范圍是0 ~ 100。數值越大,優先級越高。默認為1,如果將priority
設置為0,表示此節點永遠無法成為主節點,這樣的成員還有一個名字~被動成員。
大多數小型項目,MongoDB只有兩個副本集,為了參與選舉,MongoDB支持一種特殊類型的成員,稱為仲裁者,其唯一作用就是參與仲裁。仲裁者不參與存儲數據,也不會為程序提供服務,它只是為了幫助只有兩個副本集的集群選舉主節點(為了滿足大多數),需要注意的是,只能有一個仲裁者。
仲裁者的缺點:
假設有一個主節點,兩個從節點,一個仲裁者。如果一個從節點停止運行了,那么就需要一個新的從節點,并且將主節點的數據復制到新的從節點,復制數據會父服務器造成很大的壓力,降低程序運行速度。所以,盡可能使用奇數的從節點,而不是使用仲裁者。
MongoDB通過保存操作日志oplog使多臺服務器間保持相同的數據,oplog中保存著主節點執行的每一次寫操作。oplog存在于主節點local數據庫中的一個固定集合中,從節點通過查詢此集合以獲取需要復制的操作。
每個從節點同樣維護著自己的oplog,用來記錄它從主節點復制的每個操作。這使得每個成員都可以被用作其他成員的同步源。如果應用某個操作失敗,則從節點會停止從當前數據源復制數據。
如果一個從節點由于某種原因停止工作了,它重新啟動后,會從oplog中的最后一個操作開始同步。由于這些操作是先應用到數據上然后再寫入oplog,因此從節點可能會重復已經應用到數據上的操作。MongoDB在設計時考慮了這點,oplog中的操作執行一次和多次,效果都是一樣的,oplog中的每個操作都是冪等的。
如果某個從節點的數據遠遠落后于同步源當前的操作,那么這個從節點就是過時的。過時的從節點無法趕上同步源,如果繼續同步,從節點就需要跳過一些操作。此時,需要從其它節點進行復制,看看其它成員是否有更長的oplog以繼續同步。如果都沒有,該節點當前的復制操作將停止,需要進行完全同步或從最近的備份中恢復。
為了避免出現不同步的節點,讓主節點擁有比較大的oplog以保存足夠多的操作日志。
為了盡可能快地加載數據,哈希片鍵是最好的選擇。哈希片鍵可以使任何字段隨機分發。如果打算在大量查詢中使用升序鍵,但又想在寫操作時隨機分發,哈希片鍵是不錯的選擇,不過需要注意的是,哈希片鍵無法執行指定目標的范圍查詢。
創建哈希片鍵:
db.users.createIndex({"name":"hashed"})
有一點需要注意,哈希片鍵的字段,不能是數組。
Error: hashed indexes do not currently support array values
單獨的mongod服務器在執行升序寫操作時效率最高,這與分片相沖突,當寫操作分發在集群中時分片效率最高。每個分片上都有幾個熱點,便于寫操作在集群中均勻分發。
可以使用復合片鍵實現均勻分發,復合片鍵的第一個值可以是一個基數較小的值,片鍵的第二部分是一個升序值,這意味著在塊的內部,值總是在增加的。
比如上圖的異常,片鍵不能是數組,大多數特殊類型的索引不能用作片鍵。特別是,不能在地理空間索引上進行分片。
片鍵與索引類似,在基數高的字段上進行分片,性能會更好。如果有一個status
鍵,只有“正常”、“異常”、“錯誤”幾個值,MongoDB是無法將數據拆分成3個以上的塊(因為目前只有三個值),如果想將一個取值較小的鍵作為片鍵,那么可以將其與另一個擁有多值的鍵組成復合片鍵,比如createTime字段。這樣復合片鍵就擁有了較高的基數。
MongoDB將集合均勻分發在集群中的每個分片上,如果存儲的是同構數據,那么這種方式非常高效。如果有一個日志集合,價值不是很大,你可能不希望它存儲在性能最好的服務器上,性能最好的服務器一般會存儲重要的實時數據,而不允許其它集合使用它。
可以通過sh.addShardToZone("shard0","hign")
、sh.addShardToZone("shard1","low")
、sh.addShardToZone("shard2","low")
實現它。
可以將不同的集合分配給不同的分片,比如,對及其重要的實時集合執行:
sh.updateZoneKeyRange("super.important",{"<shardKey>":MinKey},...{"<shardKey>":MaxKey},"high")
這條命令指的是:
對于這個集合super.important
,將片鍵從負無窮到正無窮的數據保存在標記為“high”的分片上。這不會影響其它集合的均勻分發。
同樣可以通過low,將不重要的日志集合存放在性能較差的服務器上。
sh.updateZoneKeyRange("super.logs",{"<shardKey>":MinKey},...{"<shardKey>":MaxKey},"low")
此時,日志集合就會均勻的分發到shard1和shard2上。
同樣,可以通過removeShardFromZone()
從區域中刪除分片。
sh.removeShardFromZone("super.logs",{"<shardKey>":MinKey},...{"<shardKey>":MaxKey})
可以通過關閉均衡器 sh.stopBalancer()
啟動手動分發。
如果當前正在進行遷移,則此設置在遷移完成之前不會生效。一旦正在運行的遷移完成,均衡器就會停止移動數據。
除非遇到特殊情況,否則,MongoDB應該使用自動分片,而不是手動分片。
以上就是“MongoDB高可用與分片的知識點有哪些”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。