跳转至

导入数据

Studio 支持界面化地将 CSV 格式数据导入至 NebulaGraph 中。

前提条件

导入数据之前,需要确认以下信息:

  • NebulaGraph 里已经创建 Schema。
  • CSV 文件符合 Schema 要求。

入口

在顶部导航栏里,单击导入

操作步骤

导入数据主要分为 2 个部分,新建数据源和创建导入任务,接下来将详细介绍。

Note

导入任务还支持 AI 导入,该功能为 Beta 功能,使用前需要在系统设置里设置和启用该功能。

新建数据源

在页面右上角单击新建数据源,设置数据来源及其相关设置。当前支持 3 种类型的数据源。

数据源类型 说明
云存储 添加云存储作为 CSV 文件来源,只支持兼容 Amazon S3接口的云服务。
SFTP 添加 SFTP 作为 CSV 文件来源。
本地文件 上传本地 CSV 文件。文件大小不能超过 200 MB,超过限制的文件请放入其他方式的数据源中。

Note

  • 上传本地 CSV 文件时,一次可以选择多个 CSV 文件。
  • 数据源添加后,可以在页面上方单击数据源管理,切换页签即可查看不同类型的数据源详情,也可以编辑或删除数据源。

创建导入任务

  1. 在页面左上角单击创建导入任务,完成如下设置:

    Caution

    用户也可以单击导入模版,下载示例配置文件example.yaml,配置后再上传配置文件。配置方式与 NebulaGraph Importer大致相同。

    • 图空间:需要导入数据的图空间名称。
    • 任务名称:默认自动生成,可以修改。
    • 更多配置(可选):可以自定义设置并发数、批处理量、重试次数、读取并发数和导入并发数。
    • 关联标签

      1. 单击添加 Tag,然后在下方新增的标签内选择 Tag。
      2. 单击添加导入文件,在文件源里选择数据源类型文件路径,找到需要导入的文件,然后单击添加
      3. 在预览页面设置文件的分隔符和是否携带表头,然后单击确认
      4. VID 列为 VID 选择对应的列。支持选择多个列合并为 VID,也可以为 VID 添加前缀或后缀。
      5. 属性框内为属性选择对应的列。对于可以为NULL或设置了DEFAULT的属性,可以不指定对应的列。
      6. 重复 2 ~ 5 步骤将步骤 1 所选 Tag 的数据文件全部导入。
      7. 重复 1 ~ 6 步骤将所有需要导入的 Tag 数据全部导入。
    • 关联边:与关联标签的操作相同。

    Studio 导入数据截屏

  2. 完成设置后,单击导入,输入 NebulaGraph 账号的密码并确认。

导入任务创建后,可以在导入数据页签内查看导入任务的进度,支持根据图空间筛选任务、编辑任务、查看日志、下载日志、重新导入、下载配置文件、删除任务等操作。

AI 导入

Note

导入任务执行完成后,请手动检查数据是否正常导入,推荐结合导入页面的任务日志进行查看,排查超时、触发隐私政策、服务中断、编码等问题。

  1. 在页面左上角单击AI 导入,完成如下设置:

    • 文件:选择需要进行 AI 导入的文件。当前仅支持本地单个文件或本地目录。每次只能选择一个本地文件或目录。文件需要为纯文本文件。
    • 导入图空间:待导入数据的图空间。图空间的 Schema 需要提前创建好。
    • 导出 NGQL 文件路径:导出 ngql 文件的路径,通常无需修改。
    • 附加提示:可以附加其他提示来指导数据导入。提示的精度直接影响导入结果的准确性。

    你可以在配置文件中查看和 AI 导入相关的LLM参数。

  2. 完成设置后,单击下一步,确认待导入的文件和使用的 AI URL,然后单击开始

导入任务创建后,可以在导入数据页签内查看导入任务的进度,支持查看日志、下载日志、重新导入、删除任务等操作。

后续操作

完成数据导入后,用户可以进入控制台页面。


最后更新: September 6, 2024