1. 程式人生 > >大快DKH大數據基礎服務平臺監控參數說明(附圖文)

大快DKH大數據基礎服務平臺監控參數說明(附圖文)

pro 圖文 自然 size mage 排名 服務 今天 準備

標題:DKhadoop大數據處理平臺監控數據介紹
2018年國內大數據公司50強榜單排名已經公布了出來,大快以黑馬之姿闖入50強,並摘得多項桂冠。Hanlp自然語言處理技術也榮膺了“2018中國數據星技術”獎。對這份榜單感興趣的可以找一下看看。本篇承接上一篇《DKM平臺監控參數說明》,繼續就大快的大數據一體化處理架構中的平臺監控參數進行介紹和說明。
DKhadoop大數據處理平臺架構的安裝相關文章已經分享過,詳細的內容可以找一下看看。在上一篇中已經就集群平均負載、集群磁盤使用情況、HDFS監控界面、Hbase監控界面等監控參數進行說明。今天就把剩下的一些監控參數一起介紹完,關於大快大數據處理平臺監控參數的介紹就完整了。

1、Yarn監控界面
(1) 執行失敗的應用程序
技術分享圖片
監控 yarn資源管理中總執行失敗的應用程序數量
縱軸表示應用程序數量,單位個
橫軸表示時間,單位分鐘
(2)已提交的應用程序
技術分享圖片
監控 yarn資源管理中已提交的應用程序數量
縱軸表示應用程序數量,單位個
橫軸表示時間,單位分鐘

(3)正在運行的應用程序

技術分享圖片
監控 yarn資源管理中正在運行的應用程序數量
縱軸表示應用程序數量,單位個
橫軸表示時間,單位分鐘
(4) 等待執行的應用程序

技術分享圖片
監控 yarn資源管理中等待執行的應用程序數量
縱軸表示應用程序數量,單位個
橫軸表示時間,單位分鐘

(5)已完成的應用程序

技術分享圖片

監控 yarn資源管理中已完成的應用程序數量
縱軸表示應用程序數量,單位個

橫軸表示時間,單位分鐘
(6)被kill的應用程序

技術分享圖片
監控 yarn資源管理中被殺死的應用程序數量
縱軸表示應用程序數量,單位個
橫軸表示時間,單位分鐘
2、Spark監控界面
註意:(spark 運行任務後才有監控數據)
(1) 最大可使用內存

技術分享圖片
監控 Spark 集群中最大可使用的內存
縱軸表示內存容量,單位MB
橫軸表示時間,單位分鐘
(2)已使用的內存
技術分享圖片
監控 Spark 集群中已經使用的內存
縱軸表示內存容量,單位MB
橫軸表示時間,單位分鐘
(3)剩余內存
技術分享圖片

監控 Spark 集群中剩余的內存
縱軸表示內存容量,單位(MB)
橫軸表示時間,單位分鐘
(4)Spark中任務數量
技術分享圖片
監控 Spark 集群中任務數量
縱軸表示內存容量,單位MB

橫軸表示時間,單位分鐘
(5)Spark中正在運行的任務數量
技術分享圖片
監控 Spark中正在運行的任務數量
縱軸表示內存容量,單位MB
橫軸表示時間,單位分鐘
(6)正在運行的stage數量
技術分享圖片

監控 Spark集群中正在運行的stage數量
縱軸表示stage數量,單位個
橫軸表示時間,單位分鐘

(7)失敗的stage數量
技術分享圖片
監控 Spark集群中運行失敗的stage數量
縱軸表示stage數量,單位個
橫軸表示時間,單位分鐘
(8)準備就緒的stage數量
技術分享圖片

監控 Spark集群中準備就緒的stage數量
縱軸表示stage數量,單位個
橫軸表示時間,單位分鐘
備註:
(橫軸的時間表示采集時間,一般是1分鐘一次)

大快DKH大數據基礎服務平臺監控參數說明(附圖文)