您好,登錄后才能下訂單哦!
本篇內容介紹了“如何解決CDH集群安裝YARN無法正常啟動的問題”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
在安裝5.11.2版本的CDH集群時,或者為5.11.2版本的CDH集群擴容時,可能會遇到YARN的NodeManager實例無法啟動的問題。本文主要講述NodeManager無法啟動的原因以及如何解決該問題。
測試環境:
操作系統版本為Redhat7.2
CM和CDH版本為5.11.2
文章目錄結構:
1. 文檔編寫目的
2. 問題描述
3. 解決方案
3.1 問題解決
3.2 相關建議
4. 總結
在使用CDH5.11.2版本時,新增YARN的NodeManager角色,在啟動角色實例時,出現如下異常:
查看YARN的異常日志,異常信息如下:
7月 16, 晚上10點58:42.862分 FATAL org.apache.hadoop.yarn.server.nodemanager.NodeManager Error starting NodeManager org.apache.hadoop.service.ServiceStateException: org.fusesource.leveldbjni.internal.NativeDB$DBException: IO error: /var/lib/hadoop-yarn/yarn-nm-recovery/yarn-nm-state/LOCK: Permission denied at org.apache.hadoop.service.ServiceStateException.convert(ServiceStateException.java:59) at org.apache.hadoop.service.AbstractService.init(AbstractService.java:172) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.initAndStartRecoveryStore(NodeManager.java:181) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.serviceInit(NodeManager.java:245) at org.apache.hadoop.service.AbstractService.init(AbstractService.java:163) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.initAndStartNodeManager(NodeManager.java:562) at org.apache.hadoop.yarn.server.nodemanager.NodeManager.main(NodeManager.java:609) Caused by: org.fusesource.leveldbjni.internal.NativeDB$DBException: IO error: /var/lib/hadoop-yarn/yarn-nm-recovery/yarn-nm-state/LOCK: Permission denied at org.fusesource.leveldbjni.internal.NativeDB.checkStatus(NativeDB.java:200) at org.fusesource.leveldbjni.internal.NativeDB.open(NativeDB.java:218) at org.fusesource.leveldbjni.JniDBFactory.open(JniDBFactory.java:168) at org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService.openDatabase(NMLeveldbStateStoreService.java:944) at org.apache.hadoop.yarn.server.nodemanager.recovery.NMLeveldbStateStoreService.initStorage(NMLeveldbStateStoreService.java:931) at org.apache.hadoop.yarn.server.nodemanager.recovery.NMStateStoreService.serviceInit(NMStateStoreService.java:204) at org.apache.hadoop.service.AbstractService.init(AbstractService.java:163) ... 5 more |
我在Redhat7.2操作系統上部署5.11.2版本的CDH集群以及為該版本集群擴容節點都遇到過該類問題,問題的解決方法比較簡單,寫這篇文章主要是想為以后規避此類問題提供一個參考。
根據YARN的異常日志,可以看到提示的信息為“IO error:/var/lib/hadoop-yarn/yarn-nm-recovery/yarn-nm-state/LOCK: Permission denied”。需要登錄NodeManager啟動異常的節點排查問題。
1、登錄bigdata29節點,查看/var/lib/hadoop-yarn/yarn-nm-recovery/目錄,發現該目錄為空
2、查看相關目錄權限,發現hadoop-yarn目錄權限為000,定位到問題
root@bigdata29:/var/lib/hadoop-yarn>ls -lrt /var/lib/ | grep hadoop-ya d---------. 3 root root 4096 Jul 16 22:39 hadoop-yarn |
3、更改hadoop-yarn目錄權限為755
4、重啟bigdata29的NodeManager角色實例,能夠正常啟動
在添加NodeManager之前,在相關節點上手動創建/var/lib/hadoop-yarn目錄,可以避免出現該問題。如果節點數量太多,可通過批量執行命令腳本創建目錄。
在使用CDH5.11.2版本時,新增YARN的NodeManager角色,可能會出現/var/lib/hadoop-yarn/目錄權限為000的問題,出現該問題時,需要將目錄權限改為755,然后重啟NodeManager。要避免該問題可以提前創建/var/lib/hadoop-yarn/
“如何解決CDH集群安裝YARN無法正常啟動的問題”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。