黑匣子介绍¶
NebulaGraph 黑匣子功能定期收集和归档操作系统和服务指标的数据。当服务出现故障时,可以帮助用户在无直连网络的情况下快速定位问题和分析原因。
Enterpriseoly
黑匣子功能仅在 NebulaGraph 企业版中提供。
功能说明¶
黑匣子在服务器后台以进程运行并收集指标数据,目前仅收集操作系统运行时的一些性能指标(例如,CPU/Memory/Network IO 等相关指标),在未来,我们将支持收集服务指标。关于指标说明,参见 PROC。
开启黑匣子¶
黑匣子功能默认开启,系统会在 NebulaGraph 首次启动时在其安装目录下自动创建一个名为black_box
的目录,用于存储收集的指标数据。
用户可关闭黑匣子功能,参见 NebulaGraph 各个服务的配置文件中的 Black box 配置。有关配置文件详情,参见配置管理。
黑匣子文件¶
目录结构¶
在black_box
目录下,系统根据当前机器上运行的 NebulaGraph 的各个服务的进程号,自动创建以相应进程号命名的目录。在每个目录下,默认每 5 秒生成一个二进制文件,记录这段时间内的操作系统性能指标数据。文件名格式为black_box.{timestamp_id}.log
,其中timestamp_id
为文件生成时的时间戳。服务重启后,进程号变化会导致日志写到新的目录下。
├── 5776 # 服务进程号
│ ├── black_box.1665472900.log # 黑匣子文件
│ ├── black_box.1665472905.log
│ ...
├── 5787
│ ├── black_box.1665728450.log
│ ├── black_box.1665728455.log
│ ...
...
黑匣子文件的保留时长默认为 30 分钟(1800 秒),超过 30 分钟的文件会被自动删除。
黑匣子文件的生成间隔和保留时长可在 NebulaGraph 各个服务的配置文件的 Black box 配置中进行配置。有关配置文件详情,参见配置管理。
查看和分析黑匣子文件¶
可以通过 NebulaGraph Black Box 工具查看和分析黑匣子中二进制文件的数据,也可以使用该工具将二进制文件转换成 CSV 文件并导出查看。关于 NebulaGraph Black Box 工具的使用,参见黑匣子工具 Nebula-BBox。