docs/cn/operation/Metrics-System.md
度量指标信息可以让用户深入了解集群上运行的任务。这些信息对于监控和调试是宝贵的资源。Alluxio有一个基于Coda Hale Metrics库的可配置的度量指标系统。度量指标系统中,度量指标源就是该度量指标信息生成的地方,度量指标槽会使用由度量指标源生成的记录。度量指标检测系统会周期性地投票决定度量指标源,并将度量指标记录传递给度量指标槽。
Alluxio的度量指标信息被分配到各种相关Alluxio组件的实例中。每个实例中,用户可以配置一组度量指标槽,来决定报告哪些度量指标信息。现在支持下面的实例:
每个实例可以报告零个或多个度量指标槽。
度指标量系统可以通过配置文件进行配置,Alluxio中该文件默认位于$ALLUXIO_HOME/conf/metrics.properties。自定义文件位置可以通过alluxio.metrics.conf.file配置项来指定。Alluxio在conf目录下提供了一个metrics.properties.template文件,其包括所有可配置属性。默认情况下,MetricsServlet是生效的,你可以发送HTTP请求
"/metrics/json/"来获取一个以JSON格式表示的所有已注册度量信息的快照。
度量指标信息可以被分为:
下面详细展示了可用的度量指标信息。
每个master度量指标都会以master开头,例如:
master.CapacityTotal
每个worker的度量指标都会以worker的地址开头。例如某个名为
192_168_1_4.CapacityTotal
的指标就是地址为192.168.1.4的worker的度量指标。
您可以以 Java agent 的方式运行 jvm_exporter 来获取JVM相关指标。
下载 jmx_prometheus_javaagent-0.16.0.jar 并运行:
java -javaagent:./jmx_prometheus_javaagent-0.16.0.jar=8080:config.yaml -jar yourJar.jar
您可以在 http://localhost:8080/metrics 访问指标。
配置文件是 YAML 格式,为了快速使用,可以创建空白配置文件,您也可以访问 jmx_exporter 获取更多信息。