ElasticDL:Kubernetes原生的深度学习框架
ElasticDL是一个基于TensorFlow 2.0的Kubernetes原生深度学习框架,支持容错和弹性调度。
主要特点
弹性调度和容错
通过Kubernetes原生设计,ElasticDL支持容错并与Kubernetes的基于优先级的抢占一起实现深度学习任务的弹性调度。
TensorFlow 2.0急切执行
分布式深度学习框架需要在模型更新之前了解局部梯度。 Eager Execution允许ElasticDL做到这一点,而无需干预图执行过程。
简约界面
给定一个与Keras API定义,与一个命令行分布式训练模型。
el