使用 NebulaGraph Operator 安装 NebulaGraph 集群¶
采用 NebulaGraph Operator 安装 NebulaGraph 集群,能够实现集群管理的自动化,同时具备自动错误恢复的功能。本文介绍kubectl apply
和helm
两种方式来使用 NebulaGraph Operator 安装 NebulaGraph 集群。
历史版本兼容性
1.x 版本的 NebulaGraph Operator 不兼容 3.x 以下版本的 NebulaGraph 。
前提条件¶
使用kubectl apply
¶
-
创建命名空间,用于存放 NebulaGraph 集群相关资源。例如,创建
nebula
命名空间。kubectl create namespace nebula
-
创建集群的 YAML 配置文件
nebulacluster.yaml
。例如,创建名为nebula
的集群。展开查看
nebula
集群的示例配置apiVersion: apps.nebula-graph.io/v1alpha1 kind: NebulaCluster metadata: name: nebula namespace: default spec: # 控制 Pod 的调度策略。 topologySpreadConstraints: - topologyKey: "kubernetes.io/hostname" whenUnsatisfiable: "ScheduleAnyway" # 是否回收 PV。 enablePVReclaim: false # 是否启用备份和恢复功能。 exporter: image: vesoft/nebula-stats-exporter version: v3.3.0 replicas: 1 maxRequests: 20 # 自定义 Agent 镜像,用于集群备份和恢复及日志清理。 agent: image: vesoft/nebula-agent version: latest resources: requests: cpu: "100m" memory: "128Mi" limits: cpu: "200m" memory: "256Mi" # 配置镜像拉取策略。 imagePullPolicy: Always # 选择 Pod 被调度的节点。 nodeSelector: nebula: cloud # 依赖的控制器名称。 reference: name: statefulsets.apps version: v1 # 调度器名称。 schedulerName: default-scheduler # 启动 NebulaGraph Console 服务,用于连接 Graph 服务。 console: image: vesoft/nebula-console version: nightly username: "demo" password: "test" # Graph 服务的相关配置。 graphd: # 用于检测 Graph 服务是否正常运行。 # readinessProbe: # failureThreshold: 3 # httpGet: # path: /status # port: 19669 # scheme: HTTP # initialDelaySeconds: 40 # periodSeconds: 10 # successThreshold: 1 # timeoutSeconds: 10 # Graph 服务的容器镜像。 image: vesoft/nebula-graphd logVolumeClaim: resources: requests: storage: 2Gi # 用于存储 Graph 服务的日志的存储类名称。 storageClassName: local-sc # Graph 服务的 Pod 副本数。 replicas: 1 # Graph 服务的资源配置。 resources: limits: cpu: "1" memory: 1Gi requests: cpu: 500m memory: 500Mi # Graph 服务的版本。 version: v3.6.0 # 自定义 Graph 服务的 flags 配置项。 config: {} # Meta 服务的相关配置。 metad: # readinessProbe: # failureThreshold: 3 # httpGet: # path: /status # port: 19559 # scheme: HTTP # initialDelaySeconds: 5 # periodSeconds: 5 # successThreshold: 1 # timeoutSeconds: 5 # Meta 服务的容器镜像。 image: vesoft/nebula-metad logVolumeClaim: resources: requests: storage: 2Gi storageClassName: local-sc dataVolumeClaim: resources: requests: storage: 2Gi storageClassName: local-sc replicas: 1 resources: limits: cpu: "1" memory: 1Gi requests: cpu: 500m memory: 500Mi version: v3.6.0 # 自定义 Meta 服务的 flags 配置项。 config: {} # Storage 服务的相关配置。 storaged: # readinessProbe: # failureThreshold: 3 # httpGet: # path: /status # port: 19779 # scheme: HTTP # initialDelaySeconds: 40 # periodSeconds: 10 # successThreshold: 1 # timeoutSeconds: 5 # Storage 服务的容器镜像。 image: vesoft/nebula-storaged logVolumeClaim: resources: requests: storage: 2Gi storageClassName: local-sc dataVolumeClaims: - resources: requests: storage: 2Gi storageClassName: local-sc replicas: 1 resources: limits: cpu: "1" memory: 1Gi requests: cpu: 500m memory: 500Mi version: v3.6.0 # 自定义 Storage 服务的 flags 配置项。 config: {}
展开查看集群所有可配置的参数及描述
参数 默认值 描述 metadata.name
- 创建的NebulaGraph集群名称。 spec.console
- 启动 Console 容器用于连接 Graph 服务。配置详情,参见 nebula-console. spec.topologySpreadConstraints
- 控制 Pod 的调度策略。详情参见 Topology Spread Constraints。当 topologyKey
的值为kubernetes.io/zone
时,whenUnsatisfiable
的值需为DoNotSchedule
并且spec.schedulerName
的值为nebula-scheduler
。spec.graphd.replicas
1
Graphd 服务的副本数。 spec.graphd.image
vesoft/nebula-graphd
Graphd 服务的容器镜像。 spec.graphd.version
v3.6.0
Graphd 服务的版本号。 spec.graphd.service
访问 Graphd 服务的 Service 配置。 spec.graphd.logVolumeClaim.storageClassName
- Graphd 服务的日志盘存储卷的存储类名称。使用示例配置时需要将其替换为事先创建的存储类名称,参见 Storage Classes 查看创建存储类详情。 spec.metad.replicas
1
Metad 服务的副本数。 spec.metad.image
vesoft/nebula-metad
Metad 服务的容器镜像。 spec.metad.version
v3.6.0
Metad 服务的版本号。 spec.metad.dataVolumeClaim.storageClassName
- Metad 服务的数据盘存储配置。使用示例配置时需要将其替换为事先创建的存储类名称,参见 Storage Classes 查看创建存储类详情。 spec.metad.logVolumeClaim.storageClassName
- Metad 服务的日志盘存储配置。使用示例配置时需要将其替换为事先创建的存储类名称,参见 Storage Classes 查看创建存储类详情。 spec.storaged.replicas
3
Storaged 服务的副本数。 spec.storaged.image
vesoft/nebula-storaged
Storaged 服务的容器镜像。 spec.storaged.version
v3.6.0
Storaged 服务的版本号。 spec.storaged.dataVolumeClaims.resources.requests.storage
- Storaged 服务的数据盘存储大小,可指定多块数据盘存储数据。当指定多块数据盘时,路径为: /usr/local/nebula/data1
、/usr/local/nebula/data2
等。spec.storaged.dataVolumeClaims.storageClassName
- Storaged 服务的数据盘存储配置。使用示例配置时需要将其替换为事先创建的存储类名称,参见 Storage Classes 查看创建存储类详情。 spec.storaged.logVolumeClaim.storageClassName
- Storaged 服务的日志盘存储配置。使用示例配置时需要将其替换为事先创建的存储类名称,参见 Storage Classes 查看创建存储类详情。 spec.<metad|storaged|graphd>.securityContext
{}
定义集群容器的权限和访问控制,以控制访问和执行容器的操作。详情参见 SecurityContext。 spec.agent
{}
Agent 服务的配置。用于备份和恢复及日志清理功能,如果不自定义该配置,将使用默认配置。 spec.reference.name
{}
依赖的控制器名称。 spec.schedulerName
default-scheduler
调度器名称。 spec.imagePullPolicy
Always
NebulaGraph镜像的拉取策略。关于拉取策略详情,请参考 Image pull policy。 spec.logRotate
{}
日志轮转配置。详情参见管理集群日志。 spec.enablePVReclaim
false
定义是否在删除集群后自动删除 PVC 以释放数据。详情参见回收 PV。 spec.metad.licenseManagerURL
- 配置指向 LM 的 URL,由 LM 的访问地址和端口(默认端口 9119
)组成。例如,192.168.8.xxx:9119
。仅适用于创建企业版NebulaGraph集群。spec.storaged.enableAutoBalance
false
是否启用自动均衡。详情参见均衡扩容后的 Storage 数据。 spec.enableBR
false
定义是否启用 BR 工具。详情参见备份与恢复。 spec.imagePullSecrets
[]
定义拉取私有仓库中镜像所需的 Secret。 -
创建 NebulaGraph 集群。
kubectl create -f apps_v1alpha1_nebulacluster.yaml -n nebula
返回:
nebulacluster.apps.nebula-graph.io/nebula created
如果不通过
-n
指定命名空间,默认使用default
命名空间。 -
查看 NebulaGraph 集群状态。
kubectl get nebulaclusters nebula -n nebula
返回:
NAME READY GRAPHD-DESIRED GRAPHD-READY METAD-DESIRED METAD-READY STORAGED-DESIRED STORAGED-READY AGE nebula True 1 1 1 1 1 1 86s
使用helm
¶
-
添加 NebulaGraph Operator Helm 仓库(如果已添加,执行下步骤)。
helm repo add nebula-operator https://vesoft-inc.github.io/nebula-operator/charts
-
更新 Helm 仓库,拉取最新仓库资源。
helm repo update nebula-operator
-
为安装集群所需的配置参数设置环境变量。
export NEBULA_CLUSTER_NAME=nebula # NebulaGraph 集群的名字。 export NEBULA_CLUSTER_NAMESPACE=nebula # NebulaGraph 集群所处的命名空间的名字。 export STORAGE_CLASS_NAME=local-sc # NebulaGraph 集群的 StorageClass。
-
为 NebulaGraph 集群创建命名空间(如已创建,略过此步)。
kubectl create namespace "${NEBULA_CLUSTER_NAMESPACE}"
-
查看创建集群时,
nebula-operator
的nebula-cluster
chart 的可自定义的配置项。- 单击 nebula-cluster/values.yaml 查看NebulaGraph集群的所有可配置参数。
-
执行以下命令查看所有可以配置的参数。
helm show values nebula-operator/nebula-cluster
展开查看返回结果
nebula: version: v3.6.0 imagePullPolicy: Always storageClassName: "" enablePVReclaim: false enableBR: false enableForceUpdate: false schedulerName: default-scheduler topologySpreadConstraints: - topologyKey: "kubernetes.io/hostname" whenUnsatisfiable: "ScheduleAnyway" logRotate: {} reference: name: statefulsets.apps version: v1 graphd: image: vesoft/nebula-graphd replicas: 2 serviceType: NodePort env: [] config: {} resources: requests: cpu: "500m" memory: "500Mi" limits: cpu: "1" memory: "500Mi" logVolume: enable: true storage: "500Mi" podLabels: {} podAnnotations: {} securityContext: {} nodeSelector: {} tolerations: [] affinity: {} readinessProbe: {} livenessProbe: {} initContainers: [] sidecarContainers: [] volumes: [] volumeMounts: [] metad: image: vesoft/nebula-metad replicas: 3 env: [] config: {} resources: requests: cpu: "500m" memory: "500Mi" limits: cpu: "1" memory: "1Gi" logVolume: enable: true storage: "500Mi" dataVolume: storage: "2Gi" licenseManagerURL: "" license: {} podLabels: {} podAnnotations: {} securityContext: {} nodeSelector: {} tolerations: [] affinity: {} readinessProbe: {} livenessProbe: {} initContainers: [] sidecarContainers: [] volumes: [] volumeMounts: [] storaged: image: vesoft/nebula-storaged replicas: 3 env: [] config: {} resources: requests: cpu: "500m" memory: "500Mi" limits: cpu: "1" memory: "1Gi" logVolume: enable: true storage: "500Mi" dataVolumes: - storage: "10Gi" enableAutoBalance: false podLabels: {} podAnnotations: {} securityContext: {} nodeSelector: {} tolerations: [] affinity: {} readinessProbe: {} livenessProbe: {} initContainers: [] sidecarContainers: [] volumes: [] volumeMounts: [] exporter: image: vesoft/nebula-stats-exporter version: v3.3.0 replicas: 1 env: [] resources: requests: cpu: "100m" memory: "128Mi" limits: cpu: "200m" memory: "256Mi" podLabels: {} podAnnotations: {} securityContext: {} nodeSelector: {} tolerations: [] affinity: {} readinessProbe: {} livenessProbe: {} initContainers: [] sidecarContainers: [] volumes: [] volumeMounts: [] maxRequests: 20 agent: image: vesoft/nebula-agent version: latest resources: requests: cpu: "100m" memory: "128Mi" limits: cpu: "200m" memory: "256Mi" console: username: root password: nebula image: vesoft/nebula-console version: latest nodeSelector: {} alpineImage: "" imagePullSecrets: [] nameOverride: "" fullnameOverride: ""
展开查看可配置的参数描述
字段 默认值 描述 nebula.version
v3.6.0 集群的版本。 nebula.imagePullPolicy
Always
容器镜像拉取策略。 Always
表示总是尝试从远程拉取最新的镜像。nebula.storageClassName
""
Kubernetes 存储类的名称,用于动态分配持久卷。 nebula.enablePVReclaim
false
是否启用持久卷回收功能。详情参见回收 PV。 nebula.enableBR
false
是否启用备份和恢复功能。详情参见使用 NebulaGraph Operator 备份和恢复数据。 nebula.enableForceUpdate
false
是否不迁移分片 Leader 副本而强制更新 Storage 服务。详情参见优化滚动更新中的 Leader 分布。 nebula.schedulerName
default-scheduler
Kubernetes 调度器的名称。使用 Zone 功能时,必须配置为 nebula-scheduler
。nebula.topologySpreadConstraints
[]
用于控制 Pod 在集群中的分布。 nebula.logRotate
{}
日志轮替配置。详情参见管理集群日志。 nebula.reference
{"name": "statefulsets.apps", "version": "v1"}
被NebulaGraph引用的工作负载。 nebula.graphd.image
vesoft/nebula-graphd
Graph 服务的容器镜像。 nebula.graphd.replicas
2
Graph 服务的副本数量。 nebula.graphd.serviceType
NodePort
Graph 服务的 Service 类型。用来定义访问 Graph 服务的方式。详情参见连接集群。 nebula.graphd.env
[]
Graph 服务的容器环境变量。 nebula.graphd.config
{}
Graph 服务的配置。详情参见更新集群的配置。 nebula.graphd.resources
{"resources":{"requests":{"cpu":"500m","memory":"500Mi"},"limits":{"cpu":"1","memory":"500Mi"}}}
Graph 服务的资源限制和请求。 nebula.graphd.logVolume
{"logVolume": {"enable": true,"storage": "500Mi"}}
Graph 服务的日志存储配置。当 enable
为false
时,不启用日志卷。nebula.metad.image
vesoft/nebula-metad
Meta 服务的容器镜像。 nebula.metad.replicas
3
Meta 服务的副本数量。 nebula.metad.env
[]
Meta 服务的容器环境变量。 nebula.metad.config
{}
Meta 服务的配置。详情参见更新集群的配置。 nebula.metad.resources
{"resources":{"requests":{"cpu":"500m","memory":"500Mi"},"limits":{"cpu":"1","memory":"1Gi"}}}
Meta 服务的资源限制和请求。 nebula.metad.logVolume
{"logVolume": {"enable": true,"storage": "500Mi"}}
Meta 服务的日志存储配置。当 enable
为false
时,不启用日志卷。nebula.metad.dataVolume
{"dataVolume": {"storage": "2Gi"}}
Meta 服务的数据存储配置。 nebula.metad.licenseManagerURL
""
LM 访问地址和端口号,用于获取 License 信息。仅适用于创建企业版NebulaGraph集群。 nebula.storaged.image
vesoft/nebula-storaged
Storage 服务的容器镜像。 nebula.storaged.replicas
3
Storage 服务的副本数量。 nebula.storaged.env
[]
Storage 服务的容器环境变量。 nebula.storaged.config
{}
Storage 服务的配置。详情参见更新集群的配置。 nebula.storaged.resources
{"resources":{"requests":{"cpu":"500m","memory":"500Mi"},"limits":{"cpu":"1","memory":"1Gi"}}}
Storage 服务的资源限制和请求。 nebula.storaged.logVolume
{"logVolume": {"enable": true,"storage": "500Mi"}}
Storage 服务的日志存储配置。当 enable
为false
时,不启用日志卷。nebula.storaged.dataVolumes
{"dataVolumes": [{"storage": "10Gi"}]}
Storage 服务的数据存储配置。支持指定多个数据盘。 nebula.storaged.enableAutoBalance
false
是否启用自动均衡。详情参见均衡扩容后的 Storage 数据。 nebula.exporter.image
vesoft/nebula-stats-exporter
Exporter 服务的容器镜像。 nebula.exporter.version
v3.3.0
Exporter 服务的版本。 nebula.exporter.replicas
1
Exporter 服务的副本数量。 nebula.exporter.env
[]
Exporter 服务的环境变量。 nebula.exporter.resources
{"resources":{"requests":{"cpu":"100m","memory":"128Mi"},"limits":{"cpu":"200m","memory":"256Mi"}}}
Exporter 服务的资源限制和请求。 nebula.agent.image
vesoft/nebula-agent
Agent 服务的配置。用于备份和恢复及日志清理功能。 nebula.agent.version
latest
Agent 服务的版本。 nebula.agent.resources
{"resources":{"requests":{"cpu":"100m","memory":"128Mi"},"limits":{"cpu":"200m","memory":"256Mi"}}}
Agent 服务的资源限制和请求。 nebula.console.username
root
NebulaGraph命令行客户端的用户名。详情参见连接集群。 nebula.console.password
nebula
NebulaGraph命令行客户端的密码。 nebula.console.image
vesoft/nebula-console
NebulaGraph命令行客户端的容器镜像。 nebula.console.version
latest
NebulaGraph命令行客户端的版本。 nebula.alpineImage
""
Alpine Linux 容器镜像,用于获取节点所在 Zone 信息。 imagePullSecrets
[]
拉取私有镜像的 Secret 名称。 nameOverride
""
集群名称。 fullnameOverride
""
发布的实例名称。 nebula.<graphd|metad|storaged|exporter>.podLabels
{}
用于添加到 Pod 上的额外标签。 nebula.<graphd|metad|storaged|exporter>.podAnnotations
{}
用于添加到 Pod 上的额外注解。 nebula.<graphd|metad|storaged|exporter>.securityContext
{}
用于设置 Pod 的安全上下文。这可以包括运行 Pod 或容器的用户 ID、组 ID、Linux Capabilities 等。 nebula.<graphd|metad|storaged|exporter>.nodeSelector
{}
用于确定 Pod 应该在哪些节点上运行的标签选择器。 nebula.<graphd|metad|storaged|exporter>.tolerations
[]
用于允许 Pod 调度到具有特定 taints 的节点上。 nebula.<graphd|metad|storaged|exporter>.affinity
{}
用于设置 Pod 的亲和性规则,包括节点亲和性、Pod 亲和性和 Pod 反亲和性。 nebula.<graphd|metad|storaged|exporter>.readinessProbe
{}
用于检查容器是否已准备好处理服务请求。当探测器返回成功时,流量可以路由到该容器。 nebula.<graphd|metad|storaged|exporter>.livenessProbe
{}
用于检查容器是否仍在运行。如果探测器返回失败,Kubernetes 将杀死并重启容器。 nebula.<graphd|metad|storaged|exporter>.initContainers
[]
在应用容器启动之前运行的特殊容器,通常用于设置环境或初始化数据。 nebula.<graphd|metad|storaged|exporter>.sidecarContainers
[]
与主应用容器并行运行的容器,通常用于处理辅助任务,如日志处理、监控等。 nebula.<graphd|metad|storaged|exporter>.volumes
[]
定义需要附加到服务 Pod 的存储卷。 nebula.<graphd|metad|storaged|exporter>.volumeMounts
[]
指定容器内挂载存储卷的位置。
-
创建 NebulaGraph 集群。
通过
--set
参数自定义 NebulaGraph 集群配置项的默认值,例如,--set nebula.storaged.replicas=3
可设置 NebulaGraph 集群中 Storage 服务的副本数为 3。helm install "${NEBULA_CLUSTER_NAME}" nebula-operator/nebula-cluster \ # 指定集群 chart 的版本,不指定则默认安装最新版本 chart。 # 执行 helm search repo -l nebula-operator/nebula-cluster 命令可查看所有 chart 版本。 --version=1.8.0 \ # 指定 NebulaGraph 集群所处的命名空间。 --namespace="${NEBULA_CLUSTER_NAMESPACE}" \ # 自定义集群名称。 --set nameOverride="${NEBULA_CLUSTER_NAME}" \ --set nebula.storageClassName="${STORAGE_CLASS_NAME}" \ # 指定 NebulaGraph 集群的版本。 --set nebula.version=v3.6.0
-
查看 NebulaGraph 集群 Pod 的启动状态。
kubectl -n "${NEBULA_CLUSTER_NAMESPACE}" get pod -l "app.kubernetes.io/cluster=${NEBULA_CLUSTER_NAME}"
返回:
NAME READY STATUS RESTARTS AGE nebula-exporter-854c76989c-mp725 1/1 Running 0 14h nebula-graphd-0 1/1 Running 0 14h nebula-graphd-1 1/1 Running 0 14h nebula-metad-0 1/1 Running 0 14h nebula-metad-1 1/1 Running 0 14h nebula-metad-2 1/1 Running 0 14h nebula-storaged-0 1/1 Running 0 14h nebula-storaged-1 1/1 Running 0 14h nebula-storaged-2 1/1 Running 0 14h
最后更新:
2024年9月14日