你将收获

课程会带大家构建DolphinScheduler大数据调度平台,实战讲解多种任务调度配置

会基于案例讲解DolphinScheduler使用,让大家在实战中掌握DolphinScheduler。

适用人群

适合有大数据开发基础的学员

课程介绍

Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用。

 

调度系统现在市面上的调度系统那么多,比如老牌的Airflow, Oozie,Kettle,xxl-job ,Spring Batch等等, 为什么要选DolphinScheduler ?

 

DolphinScheduler 的定位是大数据工作流调度。通过把大数据和工作流做了重点标注. 从而可以知道DolphinScheduler的定位是针对于大数据体系。

 

DolphinScheduler是非常强大的大数据调度工具,有以下一些特点:

1、通过拖拽以DAG 图的方式将 Task 按照任务的依赖关系关联起来,可实时可视化监控任务的运行状态;

2、支持丰富的任务类型;

3、支持工作流定时调度、依赖调度、手动调度、手动暂停/停止/恢复,同时支持失败重试/告警、从指定节点恢复失败、Kill 任务等操作;

4、支持工作流全局参数及节点自定义参数设置;

5、支持集群HA,通过 Zookeeper实现 Master 集群和 Worker 集群去中心化;

6、支持工作流运行历史树形/甘特图展示、支持任务状态统计、流程状态统计;

7、支持补数,并行或串行回填数据。

课程会带大家构建DolphinScheduler大数据调度平台,实战讲解多种任务调度配置,会基于案例讲解DolphinScheduler使用,让大家在实战中掌握DolphinScheduler。

 

DolphinScheduler 发展很快 很多公司调度都切换到了DolphinScheduler,掌握DolphinScheduler调度使用势在必行,抓住新技术机遇,为跳巢涨薪做好准备。

课程目录

讨论留言

正在加载中...