namenode ha切換優化

發布時間：2020-07-25 09:57:58 來源：網絡閱讀：3002 作者：zouqingyun 欄目：大數據

一、背景

目前namenode使用了ha的部署模式，但系統會經常出現ha的自動切換（namenode節點其實正常）。經過調研發現可能的原因如下：

HealthMonitor check本地namenode的rpc端口時超時，導致HealthMonitor認為namenode掛掉。
zk上的session timeout，導致丟掉當前持有的active鎖（temp節點），引起自動切換。

二、優化

下面的優化將針對1）和2）調整相應的超時參數，看是否起效。修改core-site.xml

    <!-- HealthMonitor check namenode 的超時設置，默認50000ms，改為5mins -->
    <property>
        <name>ha.health-monitor.rpc-timeout.ms</name>
        <value>300000</value>
    </property>
   <!-- zk failover的session 超時設置，默認5000ms，改為3mins -->
    <property>
        <name>ha.zookeeper.session-timeout.ms</name>
        <value>180000</value>
    </property>

三、操作影響

無，不需要重啟hadoop，不會引起namenode切換

四、操作步驟

下面操作假設master1（active），master2（standby），只有按照該順序操作，才能實現namenode不切換

1）登陸master2（standby），注釋掉crontab中的restart-zkfc.sh任務，執行

sbin/hadoop-daemon.sh stop zkfc

2）登陸master1（active），注釋掉crotab中的restart-zkfc.sh任務，執行

sbin/hadoop-daemon.sh stop zkfc

3）備份master1和master2的core-site.xml文件，將上述配置項加到master1和master2的core-site.xml配置文件中

4）登陸master1（active），執行

sbin/hadoop-daemon.sh start zkfc

5）登陸master2（standby）,執行

sbin/hadoop-daemon.sh start zkfc

6）check hadoop集群狀態
7）重要!!! 登錄master1和master2，恢復crontab中的restart-zkfc.sh任務
8）完成

注意事項

1）需要先注釋掉機器上的crontab任務restart-zkfc.sh，否則該程序會自動拉起zkfc進程。導致namenode active產生切換
2）任務完成后要恢復crontab中注釋掉的restart-zkfc.sh任務

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

namenode ha切換優化

三、操作影響

四、操作步驟

注意事項

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

namenode ha切換優化

三、操作影響

四、操作步驟

注意事項

猜你喜歡

最新資訊

相關推薦

相關標簽