没有合适的资源?快使用搜索试试~ 我知道了~
如何专业化监控一个Kubernetes集群1
需积分: 0 0 下载量 183 浏览量
2022-08-03
11:30:58
上传
评论
收藏 3.08MB PDF 举报
温馨提示
试读
18页
引言Kubernetes 系统的可观测性架构Borgmon监控系统。2012年,SoundCloud的Google前员工创造了Prometheus,并作为社区开
资源详情
资源评论
资源推荐
作者:刘佳旭(佳旭)
创作期:2021-05-24
专栏地址:【稳定于切】
Kubernetes 在产环境应的普及度越来越、复杂度越来越,随之来的稳定性保障的挑战也越来越
。
如何构建全深的可观测性架构和体系,是提升系统稳定性的关键之因素。ACK将可观测性最佳实践进
沉淀,以阿云产品功能的能对户透出,可观测性具和服务成为基础设施,赋能并帮助户使产
品功能,提升户Kubernetes集群的稳定性保障和使体验。
本会介绍Kubernetes可观测性系统的构建,以及基于阿云云产品实现Kubernetes可观测系统构建的最佳
实践。
Kubernetes系统对于可观测性的挑战包括:
K8s系统架构的复杂性。系统包括控制和数据,各包含多个相互通信的组件,控制和数据间之
间通过kube-apiserver进桥接聚合。
动态性。Pod、service等资源动态创建以及分配IP,Pod重建后也会分配新的资源和IP,这就需要基于
动态服务发现来获取监控对象。
微服务架构。应按照微服务架构分解成多个组件,每个组件副本数可以根据弹性进动或者控
制。
针对Kubernetes系统可观测性的挑战,尤其在集群规模快速增的情况下,效可靠的 Kubernetes 系统可
观测性能,是系统稳定性保障的基。
那么,如何对建设产环境下的 Kubernetes 系统可观测性能呢?
Kubernetes系统的可观测性案包括指标、志、链追踪、K8s Event事件、NPD框架等式。每种式
可以从同维度透视Kubernetes系统的状态和数据。在产环境,我们通常需要综合使各种式,有时候
还要运多种式联动观测,形成完善体的可观测性体系,提对各种场景的覆盖度,进提升
Kubernetes系统的整体稳定性。下会概述产环境下对K8s系统的可观测性解决案。
Prometheus是业界指标类数据采集案的事实标准,是开源的系统监控和报警框架,灵感源Google的
如何专业化监控个Kubernetes集群
引
Kubernetes 系统的可观测性架构
1. 指标(Metrics)
Borgmon监控系统。2012,SoundCloud的Google前员创造Prometheus,并作为社区开源项进开
发。2015,该项正式发布。2016,Prometheus加CNCF云原计算基会。
Prometheus具有以下特性:
多维的数据模型(基于时间序的Key、Value键值对)
灵活的查询和聚合语PromQL
提供本地存储和分布式存储
通过基于HTTP的Pull模型采集时间序数据
可Pushgateway(Prometheus的可选中间件)实现Push模式
可通过动态服务发现或静态配置发现标机
持多种图表和数据盘
Prometheus可以周期性采集组件在HTTP(s)端点的/metrics下的指标数据,并存储到TSDB,实现基于
PromQL的查询和聚合功能。
对于Kubernetes场景下的指标,可以从如下度分类:
容基础资源指标。采集源为kubelet内置的cAdvisor,提供容内存、CPU、络、件系统等相关的
指标,指标样包括:容当前内存使字节数 container_memory_usage_bytes , 容络
接收字节数 container_network_receive_bytes_total , 容络发送字节
数 container_network_transmit_bytes_total 等等。
Kubernetes节点资源指标。采集源为 node_exporter ,提供节点系统和硬件相关的指标,指标样
包括:节点总内存 node_memory_MemTotal_bytes ,节点件系统空
间 node_filesystem_size_bytes ,节点络接ID node_network_iface_id ,等等。基
于该类指标,可以统计节点的CPU/内存/磁盘使率等节点级别指标。
Kubernetes资源指标。采集源为kube-state-metrics,基于Kubernetes API对象成指标,提供K8s集群
资源指标,如Node、ConfigMap、Deployment、DaemonSet等类型。以Node类型指标为,包括节
点Ready状态指标 kube_node_status_condition 、节点信息 kube_node_info 等等。
Kubernetes组件指标。
Kubernetes系统组件指标。如kube-controller-manager, kube-apiserver, kube-scheduler,
kubelet, kube-proxy, coredns等。
Kubernetes运维组件指标。可观测类包括 blackbox_operator , 实现对户定义的探活规则
定义; gpu_exporter ,实现对GPU资源的透出能。
Kubernetes业务应指标。包括具体的业务Pod在/metrics径透出的指标,以外部进查询和
聚合。
除上述指标,K8s提供通过API式对外透出指标的监控接标准,具体包括Resource Metrics,Custom
Metrics和External Metrics三类。
监控接标准 APIService地址 接使场景描述
Resource
Metrics
metrics.k8s.io
主要于Kubernetes内置的消费链,通常由Metrcis-
Server提供。
Custom
Metrics
custom.metrics.k8s.io
主要的实现为Prometheus,提供资源监控和定义监控
External
Metrics
external.metrics.k8s.io
主要的实现为云商的Provider,提供云资源的监控指标
Resource Metrics 类对应接metrics.k8s.io,主要的实现就是 metrics-server,它提供资源的监控,较常
的是节点级别、pod 级别、namespace 级别。这些指标可以通过kubectl top直接访问获取,或者通过K8s
controller获取,如HPA(Horizontal Pod Autoscaler)。系统架构以及访问链如下:
Custom Metrics对应的 API 是 custom.metrics.k8s.io,主要的实现是 Prometheus。它提供的是资源监控和
定义监控,资源监控和上的资源监控其实是有覆盖关系的,这个定义监控指的是:如应上想
个类似像在线数,或者说调后的这个数据库的 MySQL 的慢查询。这些其实都是可以在应层
做的定义的,然后并通过标准的 Prometheus 的 client,出相应的 metrics,然后再被 Prometheus
进采集。
这类的接旦采集上来也是可以通过类似像 custom.metrics.k8s.io 这样个接的标准来进数据消费
剩余17页未读,继续阅读
滚菩提哦呢
- 粉丝: 63
- 资源: 341
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0