您好,登錄后才能下訂單哦!
在上一篇的文章中已經明確說過DKM作為大快發行版DKhadoop的管理平臺,它的四大功能分別是:管理功能,監控功能,診斷功能和集成功能。管理功能已經給大家列舉了一些做了說明,今天就DKM平臺的監控功能再給大家做細致的分享分析。
DKM 提供了許多監控功能,用于檢測集群健康,組件性能以及集群中運行的作業的性能和資源需求。具體包括以下監控功能:
1、服務監控:
查看服務和角色實例級別健康檢查的結果,并通過圖表顯示,有助于診斷問題。如果健康檢查發現某個組件的狀態需要特別關注甚至已經出現問題,系統會對管理員應該采取的行動提出建議。同時,系統管理員還可以查看服務上的或角色上操作的執行歷史,也可以查看配置更改的審計日志。
2、主機監控
監控群集內所有主機的有關信息,包括:哪些主機上線或下線,主機上目前消耗的內存,主機上運行的角色實例分配,不同機架上的主機分配等等。匯總視圖中顯示了群集所有主機,并且可以進一步查看單個主機豐富的細節,包括顯示主機關鍵指標的直觀圖表。
3、行為監控:
DKM提供了列表以及圖表的方式來查看集群上進行的活動,可以顯示當前正在執行的任務行為,還可以查看歷史活動。同時提供了各個作業所使用資源的許多統計,系統管理員可以通過比較相似任務的不同性能數據以及比較查看同一任務中不同執行的性能數據來診斷性能問題或行為問題。
4、報警:
通過配置DKM可以對指定的事件產生警報。
5、日志:
介紹如何訪問日志中的各種考慮到你正在查看當前上下文的方式。例如,監控服務時,你可以輕松地點擊一個鏈接,查看相關的特定服務的日志條目,通過相同的用戶界面。當查看關于用戶的活動信息,您可以方便地查看作業運行時所用的作業的主機上發生的相關日志條目。
6、集群及服務實時監控:
DKM 會實時的對集群的各項服務進行監控,一旦服務出現異常,將會產生告警。同時,對集群的各項性能數據進行監控,例如CPU,內存,網絡等,一方面能夠監控集群的性能狀態,一方面能夠幫助性能調優。
7、HDFS 服務監控:
以HDFS服務為例,HDFS 服務頁面中顯示了服務狀態的匯總信息,包括HDFS綜述,HDFS 文件系統塊總數,總大小,文件總數等 。
8、節點級別監控
DKM 能夠查看單個節點的各個服務狀態
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。