1. 程式人生 > >k8s node alertmanager監控報警配置方法

k8s node alertmanager監控報警配置方法

配置 報警 www emf int fat cpu 監控 exporter

概述

節點本身的監控主要監控CPU、內存、磁盤IO、文件系統可用空間即可。
比如,對於使用來prometheus的alertmanager來做node報警,rules配置可以參考如下點進行配置即可。

說明

不同的node-exporter版本,對應的metrics也不一樣,需要自己對照更改一下。

CPU監控

(1 - avg(irate(node_cpu{mode="idle"}[10m])) by (instance)) * 100 < 90

內存監控

((node_memory_MemTotal - node_memory_MemFree) / node_memory_MemTotal) * 100 < 90

磁盤IO監控

(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10

文件系統可用空間監控

max(((node_filesystem_size{fstype=~"ext4|vfat"} - node_filesystem_free{fstype=~"ext4|vfat"}) / node_filesystem_size{fstype=~"ext4|vfat"}) * 100) by (instance) > 90

參考:https://www.dogsbodytechnology.com/blog/turning-prometheus-data-into-metrics-for-alerting/

k8s node alertmanager監控報警配置方法