使用Prometheus和Grafana構建叢集監控系統(二): 一些metric的計算語句
本文可能不定期更新.
1, node exporter的一些計算語句
CPU使用率(單位為percent) 100 - (avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[5m])) * 100) 記憶體已使用(單位為bytes) node_memory_MemTotal_bytes - node_memory_MemFree_bytes - node_memory_Cached_bytes - node_memory_Buffers_bytes - node_memory_Slab_bytes 記憶體使用量(單位為bytes/sec) node_memory_MemTotal_bytes - node_memory_MemFree_bytes - node_memory_Cached_bytes - node_memory_Buffers_bytes - node_memory_Slab_bytes 記憶體使用率(單位為percent) ((node_memory_MemTotal_bytes - node_memory_MemFree_bytes - node_memory_Cached_bytes - node_memory_Buffers_bytes - node_memory_Slab_bytes)/node_memory_MemTotal_bytes) * 100 server1的記憶體使用率(單位為percent) ((node_memory_MemTotal_bytes{instance="server1"} - node_memory_MemAvailable_bytes{instance="server1"})/node_memory_MemTotal_bytes{instance="server1"}) * 100 server2的磁碟使用率(單位為percent) ((node_filesystem_size_bytes{fstype=~"xfs|ext4",instance="server2"} - node_filesystem_free_bytes{fstype=~"xfs|ext4",instance="server2"}) / node_filesystem_size_bytes{fstype=~"xfs|ext4",instance="server2"}) * 100 uptime時間(單位為seconds) time() - node_boot_time server1的uptime時間(單位為seconds) time() - node_boot_time_seconds{instance="server1"} 網路流出量(單位為bytes/sec) irate(node_network_transmit_bytes_total{device!~"lo|bond[0-9]|cbr[0-9]|veth.*"}[5m]) > 0 server1的網路流出量(單位為bytes/sec) irate(node_network_transmit_bytes_total{instance="server1", device!~"lo|bond[0-9]|cbr[0-9]|veth.*"}[5m]) > 0 網路流入量(單位為bytes/sec) irate(node_network_receive_bytes_total{device!~"lo|bond[0-9]|cbr[0-9]|veth.*"}[5m]) > 0 server1的網路流入量(單位為bytes/sec) irate(node_network_receive_bytes_total{instance="server1", device!~"lo|bond[0-9]|cbr[0-9]|veth.*"}[5m]) > 0 磁碟讀取速度(單位為bytes/sec) irate(node_disk_read_bytes_total{device=~"sd.*"}[5m])
我的指標如何計算?
如果想統計”已使用的記憶體”, 但是我不知道如何計算?要怎麼辦?
Grafana提供了許多已經設定好的dashboards可供使用(例如這個https://grafana.com/dashboards/704), 使用起來很簡單, 在https://grafana.com/dashboards/704頁面上”Download JSON”, 然後回到自己的Grafana頁面上, 選擇左側的”Create”-“Import”即可匯入別人建立好的Dashboard. 然後可以研究一下別人的指標是如何計算的.
[/code]