您好,登錄后才能下訂單哦!
深入理解HDFS架構
優化的副本存放策略是HDFS區分其他分布式系統的重要特性。HDFS采用機架感知策略
來改進副本數據的可靠性,可用性,網絡帶寬的利用率。
通過機架感知,Namenode可以確定DataNode所屬機架id。
HDFS的存放策略是將一個副本存放在本地機架的節點上,一個副本放在同一機架的另一個節點,
最后一個副本存放在不同機架的節點上。
減少機架間的數據傳輸,提高了寫操作的效率,讀的時候更好利用多個機架的帶寬。
Namenode啟動后會進入安全模式的特殊狀態,不進行數據塊的復制。
Namenode從所有的DataNode接收心跳信號和塊狀態報告。
塊狀態報告包括DataNode所有數據塊列表。檢測各數據塊是否達到最小副本數目。
對于任何對文件系統元數據產生修改的操作,Namenode使用EditLog的事務日志記錄下來。
整個文件系統的DataNode空間,包括數據塊到文件的映射,文件的屬性等,存儲在FsaImage文件。
當NameNode啟動時,從硬盤中讀取EditLog和FsImage,將所有的EditLog事務作用在內存中的Image。
保存FsImage,刪除EditLog,這個過程稱為一個檢查點,只發生在NameNode啟動時。
如果啟用了回收站配置,用戶或應用程序刪除某個文件時,將這個文件重命名轉移到/trash目錄,以便后面的
復原。保存時間可以配置,超過時間,文件將被永遠刪除。
hadoop fs -rm /file
將file移動到回收站目錄。
hadoop fs -rm -skipTrash /file
將file直接刪除。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。