prometheus cpu load average

长话短说, prometheus里获取load/CPU个数的方法(如果有更好的方式, 欢迎告知):

(sum (node_load1{}) by (instance) / count(count(node_cpu_frequency_hertz{}) without (mode)) by (instance)) > 0.7

为什么不用下面这种CPU idle查看呢?  因为像商店一样, 有空闲的售货员不代表客户结账不需要等待.

100 – (avg by (instance) (irate(node_cpu_seconds_total{job=”consul-prometheus”,mode=”idle”}[5m])) * 100) > 70

为了提高查询性能, 可以为这个值设置recording rules.