作业实例状态
如果您已经提交作业或者发布上线作业,可通过运维中心查看和修改作业实例状态。默认显示当前实例,切换后显示历史实例。
当前实例
历史实例
实例状态
运行信息为您展示作业的实时运行信息。您可以通过作业的状态来分析、判断作业的状态是否健康、是否达到您的预期。Task状态 为您显示作业各状态的数量。Task存在以下11种状态,均为 Flink 作业状态
- 已创建
- 初始化
- 运行中
- 已完成
- 异常中
- 已异常
- 已暂停
- 停止中
- 停止
- 重启中
- 未知
作业提交或者发布后,可看到作业实例的详情信息。
如果作业长时间处于初始化状态而未发生改变时,一般是后台发生了异常,却没有被 Dinky 捕捉到,需要自行查看 log 来排查问题。 目前 Per-Job 和 Application 作业在停止时会被识别为 未知 状态。如果网络受限或者集群已被手动关闭,作业也会被识别为 未知。
作业实例信息
作业实例详细包含配置信息及运行状态和时间,各字段的含义
字段名称 | 说明 |
---|---|
作业名 | 创建的作业名称,即pipeline.name |
生命周期 | 开发中 已发布 已上线 |
运行模式 | Standalone Yarn Session Yarn Per-job Yarn Application Kubernetes Session Kubernetes Application |
集群实例 | 手动或自动注册的 Flink 集群 |
作业ID | Flink 作业的 JID |
状态 | 实例状态 |
开始时间 | 作业创建时的时间 |
耗时 | 作业运行的时长 |
如果作业状态有问题,可以进入作业信息后点击刷新按钮强制刷新作业实例状态。
修改作业状态
1.在运维中心,单击点击目标作业名
2.单击作业总览,进入作业详情页面
3.根据需要单击以下按钮,修改作业状态
其中,每个按钮含义如下表所示
操作名称 | 说明 |
---|---|
重新启动 | 作业只重新启动 |
停止 | 作业只停止 |
重新上线 | 作业重新启动,并且从保存点恢复 |
下线 | 作业触发 SavePoint 并同时停止 |
SavePoint 触发 | 作业触发 SavePoint 操作,创建一个新的保存点 |
SavePoint 暂停 | 作业触发 SavePoint 操作,并暂停作业 |
SavePoint 停止 | 作业触发 SavePoint 操作,并停止作业 |
普通停止 | 作业只停止 |
一键上下线功能说明
一键上下线功能,只针对发布后的作业
1、 一键上线: (1)点击一键上线后,出现检索和操作弹窗; (2)点击下拉框可以根据目录进行针对性的检索,检索结果出现在下面; (3)点击全选可以进行全选; (4)右上角,可以选择默认保存点或者最新保存点启动; (I) 默认保存点:以studio页面,任务页面的任务内部配置的保存点策略和点位为准; (II)最新保存点:会检索此instance的最后一次成功的保存点,进行任务保存点策略和点位的修改; (5)点击提交,即可开始提交任务 (6)可以转向上线明细功能,进行操作结果和状态的查看;
2、 上线明细: (1)名称:任务名称 (2)状态: (I)INIT:初始化 (II)OPERATING_BEFORE:操作前准备,一般指正在排队等待; (III)TASK_STATUS_NO_DONE:任务不是完成状态,任务真正执行时,状态不一致; (IV)OPERATING:正在操作 (V)EXCEPTION:系统发生异常 (VI)SUCCESS:成功 (VII)FAIL:失败 (3)结果: (I)0:CodeEnum.SUCCESS (II)1:CodeEnum.ERROR (III)5:CodeEnum.EXCEPTION (IV)401:CodeEnum.NOTLOGIN (4)信息: 上线结果描述 异常的情况下,打印异常截取 鼠标放到该字段对应位置,可以查看超长内容 (5)点位配置选择: DEFAULT_CONFIG:默认配置 LATEST:最新保存点
3、 一键下线: (1)点击一键下线后,出现检索和操作弹窗; (2)点击下拉框可以根据目录进行针对性的检索,检索结果出现在下面; (3)点击全选可以进行全选; (5)点击提交,即可开始提交任务 (6)可以转向下线明细功能,进行操作结果和状态的查看;
4、 下线明细: (1)名称:任务名称 (2)状态: (I)INIT:初始化 (II)OPERATING_BEFORE:操作前准备,一般指正在排队等待; (III)TASK_STATUS_NO_DONE:任务不是完成状态,任务真正执行时,状态不一致; (IV)OPERATING:正在操作 (V)EXCEPTION:系统发生异常 (VI)SUCCESS:成功 (VII)FAIL:失败 (3)结果: (I)0:CodeEnum.SUCCESS (II)1:CodeEnum.ERROR (III)5:CodeEnum.EXCEPTION (IV)401:CodeEnum.NOTLOGIN (4)信息: 上线结果描述 异常的情况下,打印异常截取 鼠标放到该字段对应位置,可以查看超长内容