跳转至

NebulaGraph Database 手册

导入数据

English

vesoft-inc/nebula

导入数据¶

Studio 支持界面化地将 CSV 格式数据导入至 NebulaGraph 中。

前提条件¶

导入数据之前，需要确认以下信息：

NebulaGraph 里已经创建 Schema。

CSV 文件符合 Schema 要求。

账号拥有 GOD、ADMIN 或 DBA 权限。详情参见 NebulaGraph 内置角色。

入口¶

在顶部导航栏里，单击导入。

操作步骤¶

导入数据主要分为 2 个部分，新建数据源和创建导入任务，接下来将详细介绍。

Note

导入任务还支持 AI 导入，该功能为 Beta 功能，使用前需要在系统设置里设置和启用该功能。

新建数据源¶

在页面右上角单击新建数据源，设置数据来源及其相关设置。当前支持 3 种类型的数据源。

数据源类型	说明
云存储	添加云存储作为 CSV 文件来源，只支持兼容 Amazon S3接口的云服务。
SFTP	添加 SFTP 作为 CSV 文件来源。
本地文件	上传本地 CSV 文件。文件大小不能超过 200 MB，超过限制的文件请放入其他方式的数据源中。

Note

上传本地 CSV 文件时，一次可以选择多个 CSV 文件。
数据源添加后，可以在页面上方单击数据源管理，切换页签即可查看不同类型的数据源详情，也可以编辑或删除数据源。

创建导入任务¶

在页面左上角单击创建导入任务，完成如下设置：

Caution

用户也可以单击导入模版，下载示例配置文件example.yaml，配置后再上传配置文件。配置方式与 NebulaGraph Importer大致相同。
- 图空间：需要导入数据的图空间名称。
- 任务名称：默认自动生成，可以修改。
- 更多配置（可选）：可以自定义设置并发数、批处理量、重试次数、读取并发数和导入并发数。
- 关联标签：
  1. 单击添加 Tag，然后在下方新增的标签内选择 Tag。
  2. 单击添加导入文件，在文件源里选择数据源类型和文件路径，找到需要导入的文件，然后单击添加。
  3. 在预览页面设置文件的分隔符和是否携带表头，然后单击确认。
  4. 在VID 列为 VID 选择对应的列。支持选择多个列合并为 VID，也可以为 VID 添加前缀或后缀。
  5. 在属性框内为属性选择对应的列。对于可以为NULL或设置了DEFAULT的属性，可以不指定对应的列。
  6. 重复 2 ~ 5 步骤将步骤 1 所选 Tag 的数据文件全部导入。
  7. 重复 1 ~ 6 步骤将所有需要导入的 Tag 数据全部导入。
- 关联边：与关联标签的操作相同。
完成设置后，单击导入,输入 NebulaGraph 账号的密码并确认。

导入任务创建后，可以在导入数据页签内查看导入任务的进度，支持根据图空间筛选任务、编辑任务、查看日志、下载日志、重新导入、下载配置文件、删除任务等操作。

AI 导入¶

Note

导入任务执行完成后，请手动检查数据是否正常导入，推荐结合导入页面的任务日志进行查看，排查超时、触发隐私政策、服务中断、编码等问题。

在页面左上角单击AI 导入，完成如下设置：
- 文件：选择需要进行 AI 导入的文件。当前仅支持本地单个文件或本地目录。每次只能选择一个本地文件或目录。文件需要为纯文本文件。
- 导入图空间：待导入数据的图空间。图空间的 Schema 需要提前创建好。
- 导出 NGQL 文件路径：导出 ngql 文件的路径，通常无需修改。
- 附加提示：可以附加其他提示来指导数据导入。提示的精度直接影响导入结果的准确性。
你可以在配置文件中查看和 AI 导入相关的LLM参数。
完成设置后，单击下一步，确认待导入的文件和使用的 AI URL，然后单击开始。

导入任务创建后，可以在导入数据页签内查看导入任务的进度，支持查看日志、下载日志、重新导入、删除任务等操作。

后续操作¶

完成数据导入后，用户可以进入控制台页面。

最后更新: May 9, 2024