导入数据Graph
准备好 CSV 文件,创建了 Schema 后,您可以使用 导入 功能将所有点和边数据上传到 Studio,用于数据查询、图探索和数据分析。
前提条件Graph
导入数据之前,需要确认以下信息:
- Studio 已经连接到 NebulaGraph 数据库。
- NebulaGraph 数据库里已经创建了 Schema。
- CSV 文件符合 Schema 要求。
- 您的账号拥有 GOD、ADMIN、DBA 或者 USER 的权限,能往图空间中写入数据。
操作步骤Graph
按以下步骤导入数据:
-
在工具栏里,点击 导入 页签。
-
在 选择Space 页面,选择一个图空间,再点击 下一步 按钮。
-
在 上传文件 页面,点击 上传文件 按钮,并选择需要的 CSV 文件。本示例中,选择
edge_serve.csv
、edge_follow.csv
、vertex_player.csv
和vertex_team.csv
文件。Note
您可以一次选择多个 CSV 文件。
-
在文件列表的 操作 列,点击 预览 或 删除,保证文件信息正确,之后,再点击 下一步 按钮。
-
在 关联点 页面,点击 + 绑定数据源 按钮,在对话框中选择点数据文件,并点击 确认 按钮。如本示例中的
vertex_player.csv
或vertex_team.csv
文件。 -
在 数据源 X 页签下,点击 + Tag 按钮。
-
在 vertexId 部分,完成以下操作:
-
在 对应列标 列,点击 选择。
-
在弹出对话框中,选择数据列。在本示例中,
user.csv
中仅有一列数据用于生成代表用户的 VID,course.csv
中选择表示courseName
信息的 Column 1 用于生成代表课程的 VID。Note
在同一个图空间中,VID 始终唯一,不可重复。关于 VID 的信息,参考 Graph。
-
在 ID Hash 列,选择 VID 预处理方式:如果源数据是
int
类型数据,选择 保持原值;如果源数据是string
、double
或者bool
类型数据,选择 Hash。
-
-
在 TAG 1 部分,完成以下操作:
-
在 TAG 下拉列表中,选择数据源对应的标签名称。在本示例中,
vertex_player.csv
文件对应选择 player;vertex_team.csv
文件对应选择 team。 -
在显示的属性列表中,点击 选择,为标签属性绑定源数据。在本示例中,
player
标签的name
属性对应vertex_player.csv
文件中的 Column 2 列,类型 为 string,age
属性对应文件中的 Column 1 列,类型 为 int;team
标签的name
属性对应vertex_team.csv
文件中的 Column 1 列,类型 为 string。
-
-
(可选) 如果您有多个标签数据文件,重复步骤 5 到步骤 8。
-
完成配置后,点击 下一步。
界面提示 配置验证成功,表示标签数据源绑定成功。 -
在 关联边 页面,点击 + 绑定数据源 按钮,在对话框中选择边数据文件,并点击 确认 按钮。如本示例中的
edge_follow.csv
文件。 -
在 Edge X 页签的 类型 下拉列表中,选择边类型名称。本示例中,选择 follow。
-
根据边类型的属性,从
edge_follow.csv
文件中选择相应的数据列。其中,srcId 和 dstId 分别表示边的起点与终点,所选择的数据及处理方式必须与相应的 VID 保持一致。本示例中,srcId 对应的是表示起点球员的 VID,dstId 对应的是表示终点球员的 VID。rank 为选填项,可以忽略。 -
完成设置后,点击 下一步 按钮。
-
在 导入 页面,点击 导入 按钮开始导入数据。在 log 页面上,您可以看到数据导入进度。导入所需时间因数据量而异。导入过程中,您可以点击 终止导入 停止数据导入。当 log 页面显示如图所示信息时,表示数据导入完成。
后续操作Graph
完成数据导入后,您可以开始 Graph。