跳转至

导入数据Graph

准备好 CSV 文件,创建了 Schema 后,用户可以使用 导入 功能将所有点和边数据上传到 Studio,用于数据查询、图探索和数据分析。

前提条件Graph

导入数据之前,需要确认以下信息:

  • Studio 已经连接到 NebulaGraph 数据库。
  • NebulaGraph 数据库里已经创建了 Schema。
  • CSV 文件符合 Schema 要求。
  • 账号拥有 GOD、ADMIN、DBA 或者 USER 的权限,能往图空间中写入数据。

操作步骤Graph

按以下步骤导入数据:

  1. 在工具栏里,点击 导入 页签。

  2. 选择 Space 页面,选择一个图空间,再点击 下一步 按钮。

  3. 上传文件 页面,点击 上传文件 按钮,并选择需要的 CSV 文件。本示例中,选择 edge_serve.csvedge_follow.csvvertex_player.csvvertex_team.csv 文件。

    Note

    一次可以选择多个 CSV 文件,本文使用的 CSV 文件可以在Graph 中下载。

  4. 在文件列表的 操作 列,点击 预览删除,保证文件信息正确,之后,再点击 下一步 按钮。

  5. 关联点 页面,点击 + 绑定数据源 按钮,在对话框中选择点数据文件,并点击 确认 按钮。如本示例中的 vertex_player.csvvertex_team.csv 文件。

  6. 数据源 X 页签下,点击 + Tag 按钮。

  7. vertexId 部分,完成以下操作:

    1. 对应列标 列,点击 选择
      在数据源中点击“选择”

    2. 在弹出对话框中,选择数据列。在本示例中,vertex_player.csv 中仅有一列数据用于生成代表球员的 VID,vertex_player.csv 中选择表示 playerID 信息的 Column 0 用于生成代表球员的 VID。

      Note

      在同一个图空间中,VID 始终唯一,不可重复。关于 VID 的信息,参考 Graph "点击进入 NebulaGraph 用户手册"。

  8. TAG 1 部分,完成以下操作:

    1. TAG 下拉列表中,选择数据源对应的 Tag 名称。在本示例中,vertex_player.csv 文件对应选择 playervertex_team.csv 文件对应选择 team

    2. 在显示的属性列表中,点击 选择,为 Tag 属性绑定源数据。在本示例中,player 标签的 name 属性对应 vertex_player.csv 文件中的 Column 2 列,类型stringage 属性对应文件中的 Column 1 列,类型intteam 标签的 name 属性对应 vertex_team.csv 文件中的 Column 1 列,类型string

    course 类点对应的属性数据源

  9. (可选)如果有多个 Tag 数据文件,重复步骤 5 到步骤 8。

  10. 完成配置后,点击 下一步
    界面提示 配置验证成功,表示 Tag 数据源绑定成功。

  11. 关联边 页面,点击 + 绑定数据源 按钮,在对话框中选择边数据文件,并点击 确认 按钮。如本示例中的 edge_follow.csv 文件。

  12. Edge X 页签的 类型 下拉列表中,选择 Edge type 名称。本示例中,选择 follow

  13. 根据 Edge type 的属性,从 edge_follow.csv 文件中选择相应的数据列。其中,srcIddstId 分别表示边的起点与终点,所选择的数据及处理方式必须与相应的 VID 保持一致。本示例中,srcId 对应的是表示起点球员的 VID,dstId 对应的是表示终点球员的 VID。rank 为选填项,可以忽略。

    actions 边对应的属性数据源

  14. 完成设置后,点击 下一步 按钮。

  15. 导入 页面,点击 导入 按钮开始导入数据。 在 log 页面上可以看到数据导入进度。导入所需时间因数据量而异。导入过程中可以点击 终止导入 停止数据导入。当 log 页面显示如图所示信息时,表示数据导入完成。

    log 里最后显示导入操作完成的时间、导入的行数以及操作的行数

后续操作Graph

完成数据导入后,用户可以开始Graph。


最后更新: January 14, 2022