容量推荐引擎:基于吞吐量和利用率的预测缩放
容量推荐引擎:基于吞吐量和利用率的预测缩放
本文介绍了一种容量推荐模型,实现方式相对相对比较简单,且已在 Uber 内部使用,可
以依照文中的方式开发一版容量推荐系统。
译自:Capacity Recommendation Engine: Throughput and Utilization Based Predictive Scaling
目录容量推荐引擎:基于吞吐量和利用率的预测缩放简介使用的指标 CRE 算法评估峰值
吞吐量定义目标利用率线性回归:归一化吞吐量和利用率生成建议的容量安全护栏(Guard
Rail):保障结果架构分析流:调度分析分析流:按需分析数据采集流结果结论
简介
容量是服务可靠性的关键部分。为了支持不同的业务单元,Uber 的服务需要足够的资源
来处理每天的峰值流量。这些服务部署在不同的云平台和数据中心上。手动管理容量通常会
导致过度分配资源,导致资源利用率低下。Uber 构建了一个自动扩缩容服务,用于管理和
调节上千个微服务的资源。目前的自动扩缩容服务单纯基于资源利用率指标实现的。最近我
们构建了一个新的系统,称为容量推荐引擎(Capacity Recommendation Engine (CRE)),新的
算法结合了吞吐量和利用率,并使用机器学习模型来实现扩缩容。该模型提供了黄金指标和
服务容量之间的对应关系。通过反应性预测,CRE 可以基于线性回归模型和峰值流量估算
出区域服务的容量。除了容量,分析报告还可以告诉我们不同区域服务的特性和性能回归。
本文将会深入介绍 CRE 模型以及系统架构,并提供该模型的一些分析结果。