您好,登錄后才能下訂單哦!
這篇文章主要講解了“怎么為CDH集群配置警報郵箱”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么為CDH集群配置警報郵箱”吧!
1.文章目的
多數情況下對于開發人員不太關注集群中的各服務狀態,導致在作業的時候報錯找不到原因。而對于運維人員,管理的集群太多,通過在CM管理界面上來查看集群狀態信息既不方便又不及時。在CDH集群中,Cloudera Manager 提供郵件告警的方式用來幫助運維,本文主要講述如何在CDH集群中配置警報郵箱
2.系統環境
CDH版本:cdh 5.13.1
CM 版本:cm 5.13.1
操作系統版本:redhat 7.2
CM管理界面角色要求:Full Administrator
3.操作步驟
3.1.確認Alert Publisher服務
在Cloudera Management Service > 實例,確認安裝Alert Publisher 服務,并且狀態正常
在管理>警報界面確認其他服務有啟用收集警報信息,可以根據自己的需要設置警報信息的級別和更多細節的一些警報,包括主機狀態、配置更改的警報等
3.2.配置電子郵件警報信息
在Cloudera Management Service > 配置 > 范圍篩選Alert Publisher
配置說明:
1.郵件服務器主機名稱:
可以是IP 也可以是主機名(比如263郵箱的smtp地址是: smtpcom.263xmail.com,
IP 183.61.151.35,QQ郵箱的地址是smtp.qq.com ,IP 14.18.245.164 網上可以查找)。要確保Alert Publisher服務所在的主機能與郵件服務器主機能ping通,并且25端口沒有被限制。
2.郵件服務器的用戶名和密碼
確保以該用戶名和密碼能夠正常登錄郵箱
3.郵件收件人
郵件收件人可以是多個,中間用逗號隔開
4.郵件格式
默認以HTML 的格式發送,可以修改成Text或者json 格式發送
3.3.配置后測試
配置完成后可以在管理>警報 發送測試警報
在/var/log/cloudera-scm-alertpublisher/目錄下查看日志可以看到如下信息,表明發送成功
收到測試郵件如下,日期是根據Alert Publisher 服務器的時間來決定的
啟動后的ZooKeeper 服務 canary 因未知原因失敗告警
日志信息如下:這里我們可以看到郵件發送的信息在日志中以json 格式的方式存儲的
手動Kill HBase 的HMaster進程測試:
[root@hdp01 cloudera-scm-alertpublisher]# jps
[root@hdp01 cloudera-scm-alertpublisher]# kill -9 1270
(可左右滑動)
在CM 中查看服務狀態:
/var/log/cloudera-scm-alertpublisher/查看日志信息:
手動重啟HMaster服務后日志信息:看到有一個5分鐘前有意外退出的告警。日志中顯示將批量警報傳遞給警報端
郵件信息:
4.問題處理
異常信息如下:
檢查Alert Publisher服務器節點是否能與郵件主機服務器ping 通,并且確認25端口能夠正常訪問
感謝各位的閱讀,以上就是“怎么為CDH集群配置警報郵箱”的內容了,經過本文的學習后,相信大家對怎么為CDH集群配置警報郵箱這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。