跳转至

黑匣子介绍

NebulaGraph 黑匣子功能定期收集和归档操作系统和服务指标的数据。当服务出现故障时,可以帮助用户在无直连网络的情况下快速定位问题和分析原因。

Enterpriseoly

黑匣子功能仅在 NebulaGraph 企业版中提供。

功能说明

黑匣子在服务器后台以进程运行并收集指标数据,目前仅收集操作系统运行时的一些性能指标(例如,CPU/Memory/Network IO 等相关指标),在未来,我们将支持收集服务指标。关于指标说明,参见 PROC

开启黑匣子

黑匣子功能默认开启,系统会在 NebulaGraph 首次启动时在其安装目录下自动创建一个名为black_box的目录,用于存储收集的指标数据。

用户可关闭黑匣子功能,参见 NebulaGraph 各个服务的配置文件中的 Black box 配置。有关配置文件详情,参见配置管理

黑匣子文件

目录结构

black_box目录下,系统根据当前机器上运行的 NebulaGraph 的各个服务的进程号,自动创建以相应进程号命名的目录。在每个目录下,默认每 5 秒生成一个二进制文件,记录这段时间内的操作系统性能指标数据。文件名格式为black_box.{timestamp_id}.log,其中timestamp_id为文件生成时的时间戳。服务重启后,进程号变化会导致日志写到新的目录下。

├── 5776 # 服务进程号   ├── black_box.1665472900.log # 黑匣子文件   ├── black_box.1665472905.log
│   ...
├── 5787   ├── black_box.1665728450.log
│   ├── black_box.1665728455.log
│   ...
...

黑匣子文件的保留时长默认为 30 分钟(1800 秒),超过 30 分钟的文件会被自动删除。

黑匣子文件的生成间隔和保留时长可在 NebulaGraph 各个服务的配置文件的 Black box 配置中进行配置。有关配置文件详情,参见配置管理

查看和分析黑匣子文件

可以通过 NebulaGraph Black Box 工具查看和分析黑匣子中二进制文件的数据,也可以使用该工具将二进制文件转换成 CSV 文件并导出查看。关于 NebulaGraph Black Box 工具的使用,参见黑匣子工具 Nebula-BBox


最后更新: September 4, 2023