跳转至

工作流示例

本文介绍如何创建一个简单的工作流。

前提条件

  • 已有数据源。数据源可以是 NebulaGraph 中的数据或者 HDFS 上的 CSV 文件。

新增工作流

以 MATCH 语句MATCH (v1:player)--(v2) RETURN id(v1), id(v2);的结果做为 PageRank 算法的输入,介绍如何创建一个简单的工作流。

  1. 在 Explorer 页面顶部的导航栏中,单击 Workflow

  2. 工作流标签页单击新建工作流,进入流程画布页面。

  3. 在左侧组件库列表里选择查询->Query,按住左键拖拽至画布中,单击该图查询组件,在右侧弹出的工作流配置面板中进行如下设置。

    query-component

    配置项 说明
    Query 单击pencil可以修改组件名称,方别识别。
    查询语言 选择执行nGQL语句的图空间,以及填写nGQL语句。填写语句后单击解析参数,会在输出里展示返回的列名。
    输入 设置自定义参数,可以用于参数化查询。单击添加参数可以增加更多自定义参数。
    输出 解析查询语言得到的返回结果列名。可以修改名称,相当于用AS设置列的别名。
    结果 设置结果的保存位置。为方便其他算法调用结果,图查询组件的结果只支持保存在 HDFS 上。

    Note

    连接锚点显示为黄色,表示可选,可以自行设置或者由其他任意组件提供输入。

  4. 在左侧组件库列表里选择节点重要度->PageRank,按住左键拖拽至画布中,将图查询组件的output0锚点连接至图计算组件的input0锚点,output1锚点连接至input1锚点。

    connect-component

  5. 单击该图计算组件,在右侧弹出的工作流配置面板中进行如下设置。

    connect-component

    配置项 说明
    PageRank 单击pencil可以修改组件名称,方别识别。
    输入 支持三种数据源作为输入。NebulaGraph 可以选择图空间和对应的边类型;Dependence 会根据锚点的连接情况自动识别;HDFS可以选择 HDFS 和数据源文件的相对路径。
    参数配置 设置图算法特有的参数。不同算法的参数不同,部分参数可以从任意上游组件获取,此时锚点显示为黄色。
    输出 显示图计算结果的列名,无法修改。
    执行配置 机器数量表示将要执行算法的机器数量。
    进程数量表示将要执行算法的总进程数,会根据机器数量平均分配到各个机器。
    线程数量表示每个进程会启动多少个线程。
    结果 设置结果的保存位置。可以保存在 HDFS 或 NebulaGraph 中。
    保存为 HDFS 时只需要选择 HDFS ,保存路径无需修改,会根据作业和任务 ID 自动生成。
    保存为 NebulaGraph 时,需要预先在相应图空间中创建 Tag 用于保存结果。Tag 的属性说明请参见算法简介
    部分算法只支持保存在 HDFS 上。
  6. 在画布左上角自动生成的工作流名称旁单击pencil修改工作流名称,然后在画布右上角单击运行,会自动跳转至作业页面显示作业进度,耐心等待作业完成即可查看结果。详情参见作业管理

    Note

    单击运行时,会自动进行保存,如果不执行图计算,仅仅修改,修改完成后请单击save进行保存,或者单击save另存为新的工作流。

常见问题

如何删除组件?

单击鼠标左键选择要删除的组件,单击Backspace即可删除该组件。


最后更新: September 27, 2022