91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop基礎概念是什么

發布時間:2021-12-10 09:20:58 來源:億速云 閱讀:115 作者:iii 欄目:云計算

本篇內容主要講解“Hadoop基礎概念是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Hadoop基礎概念是什么”吧!

    大數據為什么會興起?沒有大數據以前是怎么做的?這2個問題其實以我的經驗回答不是很合適,但是既然提到,就僅從個人的經驗出發來說下必要性。進入大數據行業第一節公司是一個移動SDK公司,主要是嵌入SDK通過展示廣告、APP推薦下載等來給開發者帶來收入。當時的第一個項目是分析這些SDK一天的日志(apache日志),對下載的每個APP按省份做一個排序。任務交給了SDK開發團隊,具體的方案不清楚,但是一天的數據需要跑10小時以上(記憶模糊,4年前文章提到過此事)。后來用Hadoop,寫了簡單的MR處理,大概10多分鐘就搞定了,這就是大數據存在的意義,也能從一個角度反應為什么會興起。

    關于Hadoop,首先必須要介紹下概念?現在有很多初學者,一上來就問Datanode是什么?Datanode和NodeManager能不能在一臺節點上?對于這種問題,我的回答都是“太小白,先看看書吧”。對于Hadoop的學習,很多人從Cloudera Manager或者Ambari開始,我個人非常不建議。我還是覺得實戰前,先看看書,至少翻一本熟悉了以后,其他的可以邊學邊研究。而一開始就極度依賴這些工具,概念不清楚,至少會讓人覺得不專業,不是認真學習的料子。

    版本和分支:
參考官方wiki,https://wiki.apache.org/hadoop/Roadmap,目前hadoop主流分支有3條,分別是hadoop 1.X、hadoop 2.X和hadoop 3.X。
Hadoop1.X是從hadoop 0.20發展而來,我還記得12剛開始玩hadoop的時候就是0.20.2,那時候在公司用的就是cdh4u3,后來的公司升級到了1.0,但是一直到14年離職,也都還是1.X,沒有升級到2.x,另外朋友私下聊天,其實那個時候還是以1.X為主的,2.X一般是新建集群才會使用。主要的原因就是因為升級中的風險,升級的詳細過程董西城老師有文章詳細介紹:http://dongxicheng.org/mapreduce-nextgen/hadoop-upgrade-to-version-2/
Hadoop 2.XHadoop2.0除了api的改動,對外界最大的感知就是增加了Yarn作為mapreduce的調度系統,計算資源也從單一的slot改為了內存/CPU等資源,按nodemanager不同可以區別配置。此外hadoop2.X還解決了一些1.X中的大坑點,比如單點故障,提供了基于QJM和NFS2種不同的解決方案。
Hadoop3.X當前資料不是很多,其中值得期待的就是實現了Erasure Coding(糾刪碼),EC的強大之一是可以將以往的3副本,減少為1.5副本,還能保證數據不會丟失,這一強大功能在云存儲領域廣泛應用。


后續的系列介紹中,我們選擇的版本是Hadoop2.X中的,2.6.4


概念介紹:

HDFS:Hadoop Distributed File System 

NameNode:hdfs主節點,不做實際存儲主要管理hdfs的元數據信息、維護文件塊和節點的對應關系以及維護用戶對文件的修改信息。  
DataNode:hdfs的工作節點,實際的數據處理和存儲節點。  
SecondaryNameNode:輔助節點,協助NameNode合并fsimage和edits文件,主要是做checkpoint的工作,在namenode宕機是可以及時恢復。    
CheckPoint Node:和Secondary NameNode作用一樣,只是因為Secondary名字容易混淆而添加,使用方法  
Backup Node:和Secondary、CheckPoint類似,提供checkpoint功能,但是會保留和namenode完全一致的信息  

Yarn:

ResourceManager:主節點,處理客戶端請求;管理NodeManager和Application Master;管理資源的調度和分配

NodeManager:工作節點,單個節點的資源管理;處理來自RM和AM的命令

Application Master:數據切分;為application申請資源,分配任務;監控任務的運行

                    WebAppProxyServer:顧名思義,yarn web頁面上對application的代理,主要是出于安全考慮

                    JobHistoryServer:主要負責處理任務的日志信息

            介紹了概念,開頭的問題,DataNode和NodeManager能不能部署到同一個節點就顯而易見了。答案是完全可以,而且這樣會很好,前提是要看好機器的配置,做好劃分。

到此,相信大家對“Hadoop基礎概念是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

孟津县| 永安市| 兴文县| 永春县| SHOW| 华阴市| 望谟县| 汤阴县| 滦南县| 大厂| 西乡县| 伊川县| 嘉义市| 崇州市| 霍城县| 阳江市| 平塘县| 宁城县| 富顺县| 遵义县| 新龙县| 新巴尔虎左旗| 邵阳市| 遂宁市| 镇雄县| 昭通市| 高陵县| 喜德县| 四川省| 松滋市| 射阳县| 常熟市| 交城县| 河西区| 甘泉县| 东至县| 漠河县| 黑水县| 牙克石市| 冕宁县| 云林县|