您好,登錄后才能下訂單哦!
前言:
MapReduce是用于數據處理的一種編程模型,簡單但足夠強大,專門為并行處理大數據而設計。
MapReduce的處理過程分為兩個步驟:map和reduce。每個階段的輸入輸出都是key-value的形式,key和value的類型可以自行指定。map階段對切分好的數據進行并行處理,處理結果傳輸給reduce,由reduce函數完成最后的匯總。
到了2.0之后,MapReduce可以理解為是一個jar包或一個程序,這個程序要運行在Yarn上面,上面有兩個進程,ResourceManager和NodeManager,ResourceManager里面兩個模塊是什么,Application Manager: 應用程序管理器 和 Scheduler:調度器,NodeManager相當于執行一個容器,這個容器里面有 CPU+Memory,這個容器運行一個封裝的任務,MapTask(映射任務)或者跑ReduceTask(歸約任務)
下面簡單介紹下MapReduce2架構設計或者稱為MapReduce提交到Yarn的工作流程:
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。