跳转至

NebulaGraph Database 内核手册

系统要求

vesoft-inc/nebula-docs-cn

NebulaGraph Database 内核手册

vesoft-inc/nebula-docs-cn

简介
简介
- 关于
- 关于本手册
- 目录索引
- 基本概念
  基本概念
  - 数据模型
  - 查询语言概览
- 快速开始和常用链接
  快速开始和常用链接
- 系统设计与架构
  系统设计与架构
查询语言
查询语言
- 查询语言简介
- 数据类型
  数据类型
  - 基本数据类型
  - 类型转换
- 函数与操作符
  函数与操作符
- 语言结构
  语言结构
  - 字面值常量
    字面值常量
    
    布尔类型
    
    数值类型
    
    字符串类型
  - 注释语法
  - 标识符大小写
  - 关键字和保留字
  - 管道
  - 属性引用
  - 标识符命名规则
  - 语句组合
  - 用户自定义变量
- 语句语法
  语句语法
  - 数据定义语句 (DDL)
    数据定义语句 (DDL)
    
    ALTER EDGE
    
    ALTER TAG
    
    CREATE SPACE
    
    CREATE EDGE
    
    CREATE TAG
    
    DROP EDGE
    
    DROP TAG
    
    DROP SPACE
    
    INDEX
    
    TTL
  - 数据查询与操作语句 (DQL 和 DML)
    数据查询与操作语句 (DQL 和 DML)
    
    DELETE EDGE
    
    DELETE VERTEX
    
    FETCH
    
    GO
    
    INSERT EDGE
    
    INSERT VERTEX
    
    LOOKUP
    
    RETURN
    
    UPDATE EDGE
    
    UPDATE VERTEX
    
    UPSERT
    
    WHERE
    
    YIELD
  - 辅助功能语句
    辅助功能语句
    
    SHOW 语句
    SHOW 语句
    
    SHOW CHARSET
    
    SHOW COLLATION
    
    SHOW CONFIGS
    
    SHOW CREATE SPACE
    
    SHOW CREATE TAG EDGE
    
    SHOW HOSTS
    
    SHOW INDEXES
    
    SHOW PARTS
    
    SHOW ROLES
    
    SHOW SNAPSHOTS
    
    SHOW SPACES
    
    SHOW TAGS EDGES
    
    SHOW USERS
    
    DESCRIBE
    
    USE
  - 图算法
    图算法
    
    FIND PATH
编译、部署与运维
编译、部署与运维
- 编译
  编译
  - 编译源代码
  - 使用 Docker 编译
- 安装
  安装
- 配置
  配置
- 账号权限管理
  账号权限管理
- 批量数据管理
  批量数据管理
  - 离线数据导入
    离线数据导入
    
    读取 .csv 文件
    
    Spark 导入工具
  - 离线数据转储
    离线数据转储
    
    Dump Tool
  - 负载均衡和数据迁移
  - 集群快照
  - 长耗时任务管理
  - Compact
- 监控与统计
  监控与统计
- 源码开发和 API
  源码开发和 API
  - Key Value API
  - NebulaGraph 客户端
图算法
图算法
- nebula-algorithm
  nebula-algorithm
数据传输
数据传输
- Nebula Exchange
  Nebula Exchange
  - 认识 Nebula Exchange
    认识 Nebula Exchange
    
    什么是 Nebula Exchange
    
    使用限制
    
    名词解释
    
    常见问题
  - 编译 Exchange
  - 操作指南
    操作指南
    
    导入数据步骤
    
    导入 Neo4j 数据
    
    导入 SST 文件
    
    导入 HIVE 数据
    
    导入 CSV 文件数据
    
    导入 JSON 文件数据
  - 参数说明
    参数说明
    
    Spark 参数
    
    NebulaGraph 参数
    
    导入命令参数
- Nebula Importer
  Nebula Importer
  - 导入CSV文件
- Nebula Flink Connector
  Nebula Flink Connector
- Nebula Spark Connector
  Nebula Spark Connector
  - 什么是 Nebula Spark Connector
  - 编译 Nebula Spark Connector
  - 使用限制
  - Nebula Spark Connector Reader
    Nebula Spark Connector Reader
    
    什么是 Nebula Spark Connector Reader
    
    使用示例
  - Nebula Spark Connector Writer
    Nebula Spark Connector Writer
    
    什么是 Nebula Spark Connector Writer
    
    使用示例
NebulaGraph Studio
NebulaGraph Studio
- 认识 NebulaGraph Studio
  认识 NebulaGraph Studio
- 安装与登录
  安装与登录
- 快速开始
  快速开始
- 操作指南
  操作指南
  - 管理 Schema
    管理 Schema
    
    操作图空间
    
    操作标签
    
    操作边类型
    
    操作索引
  - 使用控制台
    使用控制台
    
    控制台界面
    
    导入图探索
    
    查看子图
- 故障排查
  故障排查
社区贡献
社区贡献
附录
附录
English
English
- None

运行配置要求Graph

生产环境Graph

生产环境部署方式Graph

3 个元数据服务进程 metad
至少 3 个存储服务进程 storaged
至少 3 个查询引擎服务进程 graphd

以上进程都无需独占机器。例如一个由 5 台机器组成的集群：A、B、C、D、E，可以如下部署：

A：metad, storaged, graphd
B：metad, storaged, graphd
C：metad, storaged, graphd
D：storaged, graphd
E：storaged, graphd

同一个集群不要跨机房部署。 metad 每个进程都会创建一份元数据的存储副本，因此通常只需 3 个进程。storaged 进程数量不影响图空间数据的副本数量。

服务器配置要求(标准配置)Graph

以 AWS EC2 c5d.12xlarge 为例：

处理器：48 core
内存：96 GB
存储：2 * 900 GB, NVMe SSD
Linux 内核：3.9 或更高版本，通过命令 uname -r 查看
glibc：2.12 或更高版本，通过命令 ldd --version 查看

操作系统配置见Graph。

测试环境Graph

1 个元数据服务进程 metad
至少 1 个存储服务进程 storaged
至少 1 个查询引擎服务进程 graphd

例如一个有 3 台机器的集群：A、B、C 可以如下部署：

A：metad、storaged、graphd
B：storaged、graphd
C：storaged、graphd

服务器配置要求(最低配置)Graph

以 AWS EC2 c5d.xlarge 为例：

处理器：4 core
内存：8 GB
存储：100 GB, SSD

资源估算（3副本标准配置）Graph

存储空间（全集群）：点和边数量 * 平均属性的字节数 * 6
内存（全集群）：点边数量 * 15 字节 + RocksDB 实例数量 * (write_buffer_size * max_write_buffer_number + rocksdb_block_cache), 其中 etc/nebula-storaged.conf 文件中 --data_path 项中的每个目录对应一个 RocksDB 实例
图空间 partition 数量：全集群硬盘数量 * （2 至 10 —— 硬盘越好该值越大）
内存和硬盘另预留 20% buffer。

关于机械硬盘和千兆网络Graph

NebulaGraph 设计时主要针对的硬件设备是 NVMe SSD 和万兆网。没有对于机械磁盘和千兆网络做过适配，以下是一些需调整的参数：

etc/nebula-storage.conf：
- --raft_rpc_timeout_ms= 5000 至 10000
- --rocksdb_batch_size= 4096 至 16384
- --heartbeat_interval_secs = 30 至 60
- --raft_heartbeat_interval_secs = 30 至 60
etc/nebula-meta.conf：
- --heartbeat_interval_secs 与 etc/nebula-storage.conf 该项相同
Spark Writer:

rate: {
      timeout: 5000 至 10000
    }

go-importer:
- batchSize: 10 至 50
- concurrency: 1 至 10
- channelBufferSize：100 至 500
partition 值为全集群硬盘数量 2 倍

最后更新: August 11, 2020