「这是我参与11月更文挑战的第27天,活动详情查看:2021最后一次更文挑战」。
简介
dolphinscheduler是一个可视化DAG工作流任务调度平台,在大数据领域做任务调用非常流行
提供了类似azkaban工作流调度,比azkaban更强的可视化DAG,支持大数据领域flink,spark,shell,python,java,scala,http等各种类型任务
官网传送门: dolphinscheduler.apache.org/zh-cn/
自动化
为什么需要自动化任务处理,当你的dolphinscheduler有几百上千个任务,管理是非常耗时的,如果每个任务都配置邮件告警,那一有问题整天都在救火
此时就需要任务结果监控和任务重跑来解决 失败任务和任务自动重跑,避免浪费过多时间在维护dolphinscheduler任务上
使用
在调用api之前需要为用户申请token,按图操作
dolphinscheduler提供类似swagge接口UI工具,访问doc地址访问http://ip:12345/dolphinscheduler/doc.html?language=zh_CN&lang=cn
例子
该demo还是使用了http请求包(HttpRequest),json数据搜索包(go-jmespath)
任务结果检查
填坑说明
- 日期处理: 使用了%20转译空格,使用Sprintf方法拼接字符串
- 多种数据类型: 使用interface{}来支持int,string等多种数据类型
- 数据转换1: 将byte数据转成json格式,方便搜索
- 数据转换2: 将interface{}数据转成字符串切片,方便使用
该方法可以做成周期性任务运行,将失败的job查出来,后续是要告警通知,还是根据job名称查出对应id进行重跑任务
1 | js复制代码package main |
测试连接
如果上小节任务跑不成功,可以先运行该方法,测试连接正确性
1 | js复制代码func testConn() { |
重跑任务
重跑任务其实就是再次启动任务,直接调用start_job既可
项目名称和ID需要通过该接口获取,这个是固定的http://ip:12345/dolphinscheduler/projects/monitor/process/list-paging
调用示例: startJob(“ads_jd_order”,678)
1 | js复制代码func startJob(projectName string,projectId int) { |
小结
dolphinscheduler api调用有文档,不太复杂,但网上资料较少,需要自行摸索,博主先在这里分享一波
本文转载自: 掘金