跳转至

监控指标说明

本文介绍 Dashboard 中展示的 Nebula Graph 监控指标。

机器

Note

  • 以下机器指标适用于 Linux 操作系统。
  • 磁盘容量和流量的默认单位为字节(Byte),页面显示时单位会随着数据量级而变化,例如流量低于 1 KB/s 时单位为 Bytes/s。
  • 对于所有版本的企业版 Dashboard,机器的 Buff 和 Cache 所占的内存没有被计算在内存使用率中。

CPU

参数 说明
cpu_utilization CPU 已使用百分比
cpu_idle CPU 空闲百分比
cpu_wait 等待 IO 操作的 CPU 百分比
cpu_user 用户空间(非 Nebula Graph 图空间)占用的 CPU 百分比
cpu_system 内核空间(非 Nebula Graph 内核空间)占用的 CPU 百分比

内存

参数 说明
memory_utilization 内存已使用百分比
memory_used 已使用内存(包括缓存)
memory_actual_used 实际使用内存(不包括缓存)
memory_free 空闲内存

负载

参数 说明
load_1m 最近 1 分钟系统平均负载
load_5m 最近 5 分钟系统平均负载
load_15m 最近 15 分钟系统平均负载

磁盘

参数 说明
disk_used 磁盘已使用存储空间
disk_free 磁盘剩余存储空间
disk_readbytes 磁盘每秒读取的字节数
disk_writebytes 磁盘每秒写入的字节数
disk_readiops 磁盘每秒的读请求数量
disk_writeiops 磁盘每秒的写请求数量
inode_utilization inode 已使用百分比

流量

参数 说明
network_in_rate 网卡每秒接收的字节数
network_out_rate 网卡每秒发送的字节数
network_in_errs 网卡每秒接收错误的字节数
network_out_errs 网卡每秒发送错误的字节数
network_in_packets 网卡每秒接收的数据包数量
network_out_packets 网卡每秒发送的数据包数量

服务

周期

指标统计的时间范围,当前支持 5 秒、60 秒、600 秒和 3600 秒,分别表示最近 5 秒、最近 1 分钟、最近 10 分钟和最近 1 小时。

聚合方式

参数 说明
rate 周期内平均每秒操作的速率
sum 周期内操作的总和
avg 周期内响应平均耗时
P75 周期内响应耗时从小到大排列,顺序处于 75%位置的分位数
P95 周期内响应耗时从小到大排列,顺序处于 95%位置的分位数
P99 周期内响应耗时从小到大排列,顺序处于 99%位置的分位数
P999 周期内响应耗时从小到大排列,顺序处于 99.9%位置的分位数

Graph

参数 说明
num_queries 查询数量
num_slow_queries 慢查询数量
query_latency_us 查询平均延迟
slow_query_latency_us 慢查询平均延迟
num_query_errors 查询错误数量

Meta

参数 说明
heartbeat_latency_us 心跳延迟
num_heartbeats 心跳次数

Storage

参数 说明
add_edges_latency_us 添加边的平均延迟
add_vertices_latency_us 添加点的平均延迟
delete_edges_latency_us 删除边的平均延迟
delete_vertices_latency_us 删除点的平均延迟
get_neighbors_latency_us 查询邻居平均延迟

最后更新: March 7, 2023