CompactionGraph
本文介绍Compaction的相关信息。
NebulaGraph中,Compaction是最重要的后台操作,对性能有极其重要的影响。
Compaction操作会读取硬盘上的数据,然后重组数据结构和索引,然后再写回硬盘,可以成倍提升读取性能。将大量数据写入NebulaGraph后,为了提高读取性能,需要手动触发Compaction操作(全量Compaction)。
Note
Compaction操作会长时间占用硬盘的IO,建议在业务低峰期(例如凌晨)执行该操作。
NebulaGraph有两种类型的Compaction操作:自动Compaction和全量Compaction。
自动CompactionGraph
自动Compaction是在系统读取数据、写入数据或系统重启时自动触发Compaction操作,提升短时间内的读取性能。默认情况下,自动Compaction是开启状态,可能在业务高峰期触发,导致意外抢占IO影响业务。
全量CompactionGraph
全量Compaction可以对图空间进行大规模后台操作,例如合并文件、删除TTL过期数据等,该操作需要手动发起。使用如下语句执行全量Compaction操作:
Note
建议在业务低峰期(例如凌晨)执行该操作,避免大量占用硬盘IO影响业务。
nebula> USE <your_graph_space>;
nebula> SUBMIT JOB COMPACT;
上述命令会返回作业的ID,用户可以使用如下命令查看Compaction状态:
nebula> SHOW JOB <job_id>;
操作建议Graph
为保证NebulaGraph的性能,请参考如下操作建议:
- 数据导入完成后,请执行
SUBMIT JOB COMPACT。
- 业务低峰期(例如凌晨)执行
SUBMIT JOB COMPACT。
- 为控制
Compaction的读写速率,请在配置文件nebula-storaged.conf中设置如下参数:# 读写速率限制为20MB/S。 --rate_limit=20 (in MB/s)
FAQGraph
可以同时在多个图空间执行全量Compaction操作吗?Graph
可以,但是此时的硬盘IO会很高,可能会影响效率。
全量Compaction操作会耗费多长时间?Graph
如果已经设置读写速率限制,例如rate_limit限制为20MB/S时,用户可以通过硬盘使用量/rate_limit预估需要耗费的时间。如果没有设置读写速率限制,根据经验,速率大约为50MB/S。
可以动态调整rate_limit吗?Graph
不可以。
全量Compaction操作开始后可以停止吗?Graph
不可以停止,必须等待操作完成。这是RocksDB的限制。
最后更新: August 31, 2021