您好,登錄后才能下訂單哦!
hadoop中Yarn如何使用,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
1.mapred-site.xml
配置
進入相應的文件夾下編輯mapred-site.xml
文件,添加mapreduce.framework
屬性即可。
同樣的,在yarn-site.xml
中添加nodemanager的服務即可。
3.啟動yarn相關進程并驗證是否啟動成功
./start-yarn.sh #在sbin目錄下執行該命令可以啟動yarn
# 注意在這之前要先啟動HDFS,從控制臺的輸出中可以看出,
# 啟動了resourcemanager和nodemanager進程,jps驗證也輸出了相應的進程號。
# 啟動之后可以通過訪問http://localhost:8088來訪問yarn的管理界面。
./stop-yarn.sh #停止yarn相關進程
4.在yarn上運行hadoop示例程序
與前文一樣,我們依然運行hadoop自帶jar包例子中計算PI的程序。此處有幾點需要說明。
1)web頁面可以隨時跟蹤任務的執行狀態,剛提交時是running,執行結束后會變成finished。如上圖所示。
2)配置了yarn之后,會在計算時鏈接yarn的服務。從控制臺輸出中我們可以看到連接了ResourceManger。ResourceManager就是yarn的資源管理器。
3)對比沒有配置yarn之前的控制臺上輸出。可以看出配置yarn之后的日志更簡潔。配置之前的(部分)日志見下圖,配置之后的(部分)日志見上圖。配置之前日志信息告訴我們,執行的是一個MapReduce過程,有map task,reduce task等。而配置之后,只有mapreduce job。可以理解為是運行在yarn之上的一個map reduce作業。配置之后運行時間雖然不一定快,但yarn的統一管理對整個集群來講是更優化的。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。