91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

HDFS存在的缺陷是什么

發布時間:2021-12-09 14:36:22 來源:億速云 閱讀:243 作者:小新 欄目:大數據

這篇文章主要介紹HDFS存在的缺陷是什么,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

HDFS存在的缺陷

HDFS中的文件分配表的核心是NameNode。客戶端主要通過NameNode執行數據操作,DataNode會與其他DataNode進行通信并復制數據塊以實現冗余,這樣單一的DataNode損壞不會導致集群的數據丟失。但是NameNode一旦發生故障,后果會非常嚴重。雖然NameNode可以故障轉移,但是需要花費大量的時間。這也意味著序列中會有更多的等待時間。HDFS的垃圾回收,尤其是Java垃圾回收是需要占用大量的內存,一般是本機有效內存的10倍。

因為HDFS的設計更多的是建立在響應"一次寫入、多次讀寫"任務的基礎上。在多數情況下,分析任務都會涉及數據集中的大部分數據,也就是說,對HDFS來說,請求讀取整個數據集要比讀取一條記錄更加高效。所以HDFS在語言選擇方面更偏向于基礎語言,而不是高級語言。

傳統的操作可以用更短的時間來開發部署,維護成本更低、安全性更好。業內有這樣一種說法,大多數操作系統支持C語言、匯編和Java的原因是,文件系統處于一個較低的水平。

HDFS的工具和其他文件系統的工具相較是有差距的。比起你曾經處理的任何文件系統或分布式存儲HDFS周圍的工具是一種較差。基于Java的文件系統只能搭上IT人員最喜愛的POSIX工具的末班車。你嘗試過NFS掛載HDFS嗎?其它的HDFS工具的安裝也是非常復雜的。相反的,如果你使用REST  bridge Tool和客戶端命令行就會非常容易。

HDFS支持原生代碼擴展,提高了運行效率。另外,社區也為NameNode的發展做出了很多貢獻。如果你想要打造一個高端的系統,那么必須打破監測和診斷工具中的NameNode瓶頸。總之,在操作系統上使用基于C或C  ++的較為成熟的分布式文件系統往往是一個更好的選擇。

Spark和云計算需求的變化

早期的Hadoop企業部署基本上是在本地完成的,隨著Spark和云部署的崛起,使用Amazon S3作為數據源的情況漸漸多了起來。

Hadoop供應商都期望能夠出現更為統一的Hadoop平臺,期望HDFS能夠與安全組件集成。Spark本身就因文件系統的多樣性而存在很多矛盾,所以,想要和文件系統緊密集成幾乎是不可能的。

MAPR FS文件系統漸漸引起了企業的興趣。MAPR FS沒有NameNode,而是采用了更標準和熟悉的集群方案方案。  MAPR的分區設計也很好的避免了瓶頸。

除了上述的分布式文件系統,還有很多的分布式文件系統可以供選擇,例如Ceph、Gluster。Gluster是一種更為標準的分布式文件系統,擅長I/O操作。目前,大多數人選擇使用Spark來存儲文件是因為他們對于Spark更加熟悉,而并非是因為它性能好、速度快。

大型HDFS安裝的遷移是不可能一蹴而就的,但是隨著時間的遷移,未來我們在Spark和云項目中會越來越少的看到HDFS。也許,HDFS會脫離YARN,單獨成為Hadoop的一部分。

以上是“HDFS存在的缺陷是什么”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

应城市| 隆林| 丰镇市| 灌南县| 易门县| 濉溪县| 安顺市| 满洲里市| 蒙阴县| 汾阳市| 岳普湖县| 利辛县| 张北县| 寿光市| 许昌县| 遵义市| 寻甸| 德化县| 攀枝花市| 新竹县| 武川县| 奉化市| 凭祥市| 什邡市| 兴业县| 焦作市| 吉首市| 辉县市| 蛟河市| 林州市| 衡南县| 宁陕县| 永城市| 衡水市| 夹江县| 三河市| 佛山市| 富川| 怀远县| 永德县| 泰州市|