Storage服务配置Graph
Storage服务提供了两份初始配置文件nebula-storaged.conf.default
和nebula-storaged.conf.production
,方便在不同场景中使用。文件的默认路径为/usr/local/nebula/etc/
。
Caution
- 不建议修改
local_config
的值为false
。修改后NebulaGraph服务启动后会先尝试从Meta服务获取缓存的配置信息,可能导致集群配置不一致,造成未知风险。 - 不建议修改文档未介绍的配置项,除非已经熟悉源代码并完全了解配置项的作用。
配置文件使用方式Graph
如需使用初始配置文件,从上述两个文件选择其一,删除后缀.default
或.production
,Meta服务才能将其识别为配置文件并从中获取配置信息。
配置文件参数值说明Graph
配置文件内没有设置某个参数表示参数使用的是默认值。文件内只预设了部分参数的值,而且两份初始配置文件内的参数值也略有不同,本文的预设值以nebula-metad.conf.default
为准。
Note
Raft Listener的配置和Storage服务配置不同,详情请参见Graph。
如需查看所有的参数及其当前值,参见Graph。
basics配置Graph
名称 | 预设值 | 说明 |
---|---|---|
daemonize |
true |
是否启动守护进程。 |
pid_file |
pids/nebula-storaged.pid |
记录进程ID的文件。 |
timezone_name |
- | 指定NebulaGraph的时区。初始配置文件中未设置该参数,如需使用请手动添加。系统默认值为UTC+00:00:00 。格式请参见Graph。例如,东八区的设置方式为--timezone_name=UTC+08:00 。 |
local_config |
true |
是否从配置文件获取配置信息。 |
Note
- 在插入Graph的属性值时,NebulaGraph会根据
timezone_name
设置的时区将该时间值(TIMESTAMP类型例外)转换成相应的UTC时间,因此在查询中返回的时间类型属性值为UTC时间。 timezone_name
参数只用于转换NebulaGraph中存储的数据,NebulaGraph进程中其它时区相关数据,例如日志打印的时间等,仍然使用主机系统默认的时区。
logging配置Graph
名称 | 预设值 | 说明 |
---|---|---|
log_dir |
logs |
存放Storage服务日志的目录,建议和数据保存在不同硬盘。 |
minloglevel |
0 |
最小日志级别,即不会记录低于这个级别的日志。可选值为0 (INFO)、1 (WARNING)、2 (ERROR)、3 (FATAL)。建议在调试时设置为0 ,生产环境中设置为1 。如果设置为4 ,NebulaGraph不会记录任何日志。 |
v |
0 |
日志详细级别,值越大,日志记录越详细。可选值为0 、1 、2 、3 。 |
logbufsecs |
0 |
缓冲日志的最大时间,超时后输出到日志文件。0 表示实时输出。单位:秒。 |
redirect_stdout |
true |
是否将标准输出和标准错误重定向到单独的输出文件。 |
stdout_log_file |
storaged-stdout.log |
标准输出日志文件名称。 |
stderr_log_file |
storaged-stderr.log |
标准错误日志文件名称。 |
stderrthreshold |
2 |
要复制到标准错误中的最小日志级别(minloglevel )。 |
networking配置Graph
名称 | 预设值 | 说明 |
---|---|---|
meta_server_addrs |
127.0.0.1:9559 |
全部Meta服务的IP地址和端口。多个Meta服务用英文逗号(,)分隔。 |
local_ip |
127.0.0.1 |
Storage服务的本地IP地址。本地IP地址用于识别nebula-storaged进程,如果是分布式集群或需要远程访问,请修改为对应地址。 |
port |
9779 |
Storage服务的RPC守护进程监听端口。Storage服务对外端口为9779 ,对内端口为9777 、9778 和9780 ,NebulaGraph使用内部端口进行多副本间的交互。 |
ws_ip |
0.0.0.0 |
HTTP服务的IP地址。 |
ws_http_port |
19779 |
HTTP服务的端口。 |
ws_h2_port |
19780 |
HTTP2服务的端口。 |
heartbeat_interval_secs |
10 |
默认心跳间隔。请确保所有服务的heartbeat_interval_secs 取值相同,否则会导致系统无法正常工作。单位:秒。 |
Caution
必须在配置文件中使用真实的IP地址。否则某些情况下127.0.0.1/0.0.0.0
无法正确解析。
raft配置Graph
名称 | 预设值 | 说明 |
---|---|---|
raft_heartbeat_interval_secs |
30 |
Raft选举超时时间。单位:秒。 |
raft_rpc_timeout_ms |
500 |
Raft客户端的远程过程调用(RPC)超时时间。单位:毫秒。 |
wal_ttl |
14400 |
Raft WAL的生存时间。单位:秒。 |
disk配置Graph
名称 | 预设值 | 说明 |
---|---|---|
data_path |
data/storage |
数据存储路径,多个路径用英文逗号(,)分隔。一个RocksDB实例对应一个路径。 |
minimum_reserved_bytes |
268435456 |
每个数据存储路径的剩余空间最小值,低于该值时,可能会导致集群数据写入失败。单位:字节。默认为1073741824 ,即1GB。 |
rocksdb_batch_size |
4096 |
批量操作的缓存大小。单位:字节。 |
rocksdb_block_cache |
4 |
BlockBasedTable的默认块缓存大小。单位:兆(MB)。 |
engine_type |
rocksdb |
存储引擎类型。 |
rocksdb_compression |
lz4 |
压缩算法,可选值为no 、snappy 、lz4 、lz4hc 、zlib 、bzip2 和zstd 。 |
rocksdb_compression_per_level |
- | 为不同级别设置不同的压缩算法。 |
enable_rocksdb_statistics |
false |
是否启用RocksDB的数据统计。 |
rocksdb_stats_level |
kExceptHistogramOrTimers |
RocksDB的数据统计级别。可选值为kExceptHistogramOrTimers (禁用计时器统计,跳过柱状图统计)、kExceptTimers (跳过计时器统计)、kExceptDetailedTimers (收集除互斥锁和压缩花费时间之外的所有统计数据)、kExceptTimeForMutex 收集除互斥锁花费时间之外的所有统计数据)和kAll (收集所有统计数据)。 |
enable_rocksdb_prefix_filtering |
false |
是否启用prefix bloom filter (内存充裕时可以打开,提升图遍历速度)。 |
enable_rocksdb_whole_key_filtering |
true |
是否启用whole key bloom filter。 |
rocksdb_filtering_prefix_length |
12 |
每个key的prefix长度。可选值为12 (分片ID+点ID)和16 (分片ID+点ID+TagID/Edge typeID)。单位:字节。 |
enable_partitioned_index_filter |
- | 设置为true 可以降低bloom过滤器占用的内存大小,但是在某些随机寻道(random-seek)的情况下,可能会降低读取性能。 |
rocksdb options配置Graph
名称 | 预设值 | 说明 |
---|---|---|
rocksdb_db_options |
{} |
RocksDB database选项。 |
rocksdb_column_family_options |
{"write_buffer_size":"67108864", "max_write_buffer_number":"4", "max_bytes_for_level_base":"268435456"} |
RocksDB column family选项。 |
rocksdb_block_based_table_options |
{"block_size":"8192"} |
RocksDB block based table选项。 |
rocksdb options配置的格式为{"<option_name>":"<option_value>"}
,多个选项用英文逗号(,)隔开。
rocksdb_db_options
和rocksdb_column_family_options
支持的选项如下:
rocksdb_db_options
max_total_wal_size delete_obsolete_files_period_micros max_background_jobs stats_dump_period_sec compaction_readahead_size writable_file_max_buffer_size bytes_per_sync wal_bytes_per_sync delayed_write_rate avoid_flush_during_shutdown max_open_files stats_persist_period_sec stats_history_buffer_size strict_bytes_per_sync enable_rocksdb_prefix_filtering enable_rocksdb_whole_key_filtering rocksdb_filtering_prefix_length num_compaction_threads rate_limit
rocksdb_column_family_options
参数的详细说明请参见Graph。write_buffer_size max_write_buffer_number level0_file_num_compaction_trigger level0_slowdown_writes_trigger level0_stop_writes_trigger target_file_size_base target_file_size_multiplier max_bytes_for_level_base max_bytes_for_level_multiplier disable_auto_compactions
超级节点处理(出入边数量极多的点)Graph
在每个点出发的查询获取到边时,直接截断。目的是避免超级节点的邻边过多,单个查询占用过多的硬盘和内存。截取前 max_edge_returned_per_vertex
个边,多余的边不返回。该参数作用于全局,不用于单个space。
属性名 | 默认值 | 说明 |
---|---|---|
max_edge_returned_per_vertex | 2147483647 | 每个稠密点,最多返回多少条边,多余的边截断不返回。配置文件默认未设置。 |
Compatibility
NebulaGraph 1.x 中的蓄水池采样方法在 NebulaGraph 2.5.0 不再支持。
数据量大而内存不够时Graph
如果数据量很大但内存不够,则推荐把 storage 配置中的 enable_partitioned_index_filter
设置为 true
;但由于缓存了较少的 RocksDB 索引,性能会受影响。