您好,登錄后才能下訂單哦!
這篇文章主要介紹了HDFS有什么作用,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
1、HDFS是啥?
HDFS(Hadoop Distributed File System,Hadoop分布式文件系統),它是一個高度容錯性的系統,適合部署在廉價的機器上。HDFS能提供高吞吐量的數據訪問,適合那些有著超大數據集(large data set)的應用程序。
2、HDFS特點是個啥?
1、大數據文件,可以存儲大數據文件,小的話用不著,單機就可以了,殺雞焉用牛刀。理論上如果管理節點的內存足夠的話,無上限,但是畢竟硬件條件有限。如果一個block 128M,每個block需要4kb的管理信息 namenode內存有8G 那么8G/4kb*128就是她這個集群的上限。
2、文件分塊存儲,HDFS會將一個完整的大文件平均分塊存儲到不同計算器上,塊的大小64M,128M, 256M都可以(看情況),它的意義在于讀取文件時可以同時從多個主機取不同區塊的文件,多主機讀取比單主機讀取效率要高得多得都。
3、流式數據訪問,一次寫入多次讀寫,這種模式跟傳統文件不同,它不支持動態改變文件內容,而是要求讓文件一次寫入就不做變化,要變化也只能在文件末添加內容。
4、廉價硬件,HDFS可以應用在普通PC機上,這種機制能夠讓給一些公司用幾十臺廉價的計算機就可以撐起一個大數據集群。
5、硬件故障,HDFS認為所有計算機都可能會出問題,為了防止某個主機失效讀取不到該主機的塊文件,它將同一個文件塊副本分配到其它某幾個主機上,如果其中一臺主機失效,可以迅速找另一塊副本取文件。所以一般block備份三份,namenode 備份一份。
3、總結
HDFS就是一個將大數據量的文件分割成成大小相等的block中,這個block一般為 62M,128M等,并存儲到集群中,可以一次存儲,多次讀取,不易修改,不適合做交互,時效性低
感謝你能夠認真閱讀完這篇文章,希望小編分享的“HDFS有什么作用”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。