导入数据¶
Studio 支持界面化地将 CSV 格式数据导入至 NebulaGraph 中。
前提条件¶
导入数据之前,需要确认以下信息:
- NebulaGraph 里已经创建 Schema。
- CSV 文件符合 Schema 要求。
- 账号拥有 GOD、ADMIN 或 DBA 权限。详情参见 NebulaGraph 内置角色。
入口¶
在顶部导航栏里,单击导入。
操作步骤¶
导入数据主要分为 2 个部分,新建数据源和创建导入任务,接下来将详细介绍。
Note
导入任务还支持 AI 导入,该功能为 Beta 功能,使用前需要在系统设置里设置和启用该功能。
新建数据源¶
在页面右上角单击新建数据源,设置数据来源及其相关设置。当前支持 3 种类型的数据源。
数据源类型 | 说明 |
---|---|
云存储 | 添加云存储作为 CSV 文件来源,只支持兼容 Amazon S3接口的云服务。 |
SFTP | 添加 SFTP 作为 CSV 文件来源。 |
本地文件 | 上传本地 CSV 文件。文件大小不能超过 200 MB,超过限制的文件请放入其他方式的数据源中。 |
Note
- 上传本地 CSV 文件时,一次可以选择多个 CSV 文件。
- 数据源添加后,可以在页面上方单击数据源管理,切换页签即可查看不同类型的数据源详情,也可以编辑或删除数据源。
创建导入任务¶
-
在页面左上角单击创建导入任务,完成如下设置:
Caution
用户也可以单击导入模版,下载示例配置文件
example.yaml
,配置后再上传配置文件。配置方式与 NebulaGraph Importer大致相同。- 图空间:需要导入数据的图空间名称。
- 任务名称:默认自动生成,可以修改。
- 更多配置(可选):可以自定义设置并发数、批处理量、重试次数、读取并发数和导入并发数。
-
关联标签:
- 单击添加 Tag,然后在下方新增的标签内选择 Tag。
- 单击添加导入文件,在文件源里选择数据源类型和文件路径,找到需要导入的文件,然后单击添加。
- 在预览页面设置文件的分隔符和是否携带表头,然后单击确认。
- 在VID 列为 VID 选择对应的列。支持选择多个列合并为 VID,也可以为 VID 添加前缀或后缀。
- 在属性框内为属性选择对应的列。对于可以为
NULL
或设置了DEFAULT
的属性,可以不指定对应的列。 - 重复 2 ~ 5 步骤将步骤 1 所选 Tag 的数据文件全部导入。
- 重复 1 ~ 6 步骤将所有需要导入的 Tag 数据全部导入。
- 关联边:与关联标签的操作相同。
-
完成设置后,单击导入,输入 NebulaGraph 账号的密码并确认。
导入任务创建后,可以在导入数据页签内查看导入任务的进度,支持根据图空间筛选任务、编辑任务、查看日志、下载日志、重新导入、下载配置文件、删除任务等操作。
AI 导入¶
Note
导入任务执行完成后,请手动检查数据是否正常导入,推荐结合导入页面的任务日志进行查看,排查超时、触发隐私政策、服务中断、编码等问题。
-
在页面左上角单击AI 导入,完成如下设置:
- 文件:选择需要进行 AI 导入的文件。当前仅支持本地单个文件或本地目录。每次只能选择一个本地文件或目录。文件需要为纯文本文件。
- 导入图空间:待导入数据的图空间。图空间的 Schema 需要提前创建好。
- 导出 NGQL 文件路径:导出 ngql 文件的路径,通常无需修改。
- 附加提示:可以附加其他提示来指导数据导入。提示的精度直接影响导入结果的准确性。
你可以在配置文件中查看和 AI 导入相关的
LLM
参数。 -
完成设置后,单击下一步,确认待导入的文件和使用的 AI URL,然后单击开始。
导入任务创建后,可以在导入数据页签内查看导入任务的进度,支持查看日志、下载日志、重新导入、删除任务等操作。
后续操作¶
完成数据导入后,用户可以进入控制台页面。
最后更新:
2024年12月19日