您好,登錄后才能下訂單哦!
HDFS (Hadoop Distributed File System)是 Hadoop 下的分布式文件系統,具有高容錯、高吞吐量等特性,可以部署在低成本的硬件上。
HDFS 遵循主/從架構,由單個 NameNode(NN) 和多個 DataNode(DN) 組成:
文件系統命名空間
的操作,例如打開,關閉、重命名文件和目錄等。它同時還負責集群元數據的存儲,記錄著文件中各個數據塊的位置信息。HDFS 的 文件系統命名空間
的層次結構與大多數文件系統類似 (如 Linux), 支持目錄和文件的創建、移動、刪除和重命名等操作,支持配置用戶和訪問權限,但不支持硬鏈接和軟連接。NameNode
負責維護文件系統名稱空間,記錄對名稱空間或其屬性的任何更改。
由于 Hadoop 被設計運行在廉價的機器上,這意味著硬件是不可靠的,為了保證容錯性,HDFS 提供了數據復制機制。HDFS 將每一個文件存儲為一系列塊,每個塊由多個副本來保證容錯,塊的大小和復制因子可以自行配置(默認情況下,塊大小是 128M,默認復制因子是 3)。
大型的 HDFS 實例在通常分布在多個機架的多臺服務器上,不同機架上的兩臺服務器之間通過交換機進行通訊。在大多數情況下,同一機架中的服務器間的網絡帶寬大于不同機架中的服務器之間的帶寬。因此 HDFS 采用機架感知副本放置策略,對于常見情況,當復制因子為 3 時,HDFS 的放置策略是:
在寫入程序位于 datanode
上時,就優先將寫入文件的一個副本放置在該 datanode
上,否則放在隨機 datanode
上。之后在另一個遠程機架上的任意一個節點上放置另一個副本,并在該機架上的另一個節點上放置最后一個副本。此策略可以減少機架間的寫入流量,從而提高寫入性能。
<div align="center"> <img src="https://raw.githubusercontent.com/heibaiying/BigData-Notes/master/pictures/hdfs-機架.png"/> </div>
如果復制因子大于 3,則隨機確定第 4 個和之后副本的放置位置,同時保持每個機架的副本數量低于上限,上限值通常為 (復制系數 - 1)/機架數量 + 2
,需要注意的是不允許同一個 dataNode
上具有同一個塊的多個副本。
為了最大限度地減少帶寬消耗和讀取延遲,HDFS 在執行讀取請求時,優先讀取距離讀取器最近的副本。如果在與讀取器節點相同的機架上存在副本,則優先選擇該副本。如果 HDFS 群集跨越多個數據中心,則優先選擇本地數據中心上的副本。
每個 DataNode 定期向 NameNode 發送心跳消息,如果超過指定時間沒有收到心跳消息,則將 DataNode 標記為死亡。NameNode 不會將任何新的 IO 請求轉發給標記為死亡的 DataNode,也不會再使用這些 DataNode 上的數據。 由于數據不再可用,可能會導致某些塊的復制因子小于其指定值,NameNode 會跟蹤這些塊,并在必要的時候進行重新復制。
由于存儲設備故障等原因,存儲在 DataNode 上的數據塊也會發生損壞。為了避免讀取到已經損壞的數據而導致錯誤,HDFS 提供了數據完整性校驗機制來保證數據的完整性,具體操作如下:
當客戶端創建 HDFS 文件時,它會計算文件的每個塊的 校驗和
,并將 校驗和
存儲在同一 HDFS 命名空間下的單獨的隱藏文件中。當客戶端檢索文件內容時,它會驗證從每個 DataNode 接收的數據是否與存儲在關聯校驗和文件中的 校驗和
匹配。如果匹配失敗,則證明數據已經損壞,此時客戶端會選擇從其他 DataNode 獲取該塊的其他可用副本。
FsImage
和 EditLog
是 HDFS 的核心數據,這些數據的意外丟失可能會導致整個 HDFS 服務不可用。為了避免這個問題,可以配置 NameNode 使其支持 FsImage
和 EditLog
多副本同步,這樣 FsImage
或 EditLog
的任何改變都會引起每個副本 FsImage
和 EditLog
的同步更新。
快照支持在特定時刻存儲數據副本,在數據意外損壞時,可以通過回滾操作恢復到健康的數據狀態。
由于 HDFS 采用數據的多副本方案,所以部分硬件的損壞不會導致全部數據的丟失。
HDFS 設計的重點是支持高吞吐量的數據訪問,而不是低延遲的數據訪問。
HDFS 適合于大文件的存儲,文檔的大小應該是是 GB 到 TB 級別的。
HDFS 更適合于一次寫入多次讀取 (write-once-read-many) 的訪問模型。支持將內容追加到文件末尾,但不支持數據的隨機訪問,不能從文件任意位置新增數據。
HDFS 具有良好的跨平臺移植性,這使得其他大數據計算框架都將其作為數據持久化存儲的首選方案。
說明:以下圖片引用自博客:翻譯經典 HDFS 原理講解漫畫
第二部分:讀寫故障的處理
第三部分:DataNode 故障處理
副本布局策略:
更多大數據系列文章可以參見 GitHub 開源項目: 大數據入門指南
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。