监控系统
随着企业经营规模的扩大,以及对内快速诊断效率和对外服务品质的追求,
对于业务系统的掌控度的要求越来越高,主要体现在:
对于第三方依赖的监控,实时/准实时了解第三方的健康状况/服务品质,降
低第三方依赖对于自身系统的扰动(服务降级、故障转移)。
对于容器的监控,实时/准实时的了解应用部署环境(CPU、内存、进程、
线程、网络、带宽)情况,以便快速扩容/缩容、流量控制、业务迁移。
业务方对于自己的调用情况,方便作容量规划,同时对于突发的请求也能
进行异常告警和应急准备。
自己业务的健康、性能监控,实时/准实时的了解自身的业务运行情况,排
查业务瓶颈,快速诊断和定位异常,增加对自己业务的掌控力。
在这种情况下,一般都会引入 APM(Application Performance
Management & Monitoring)系统,通过各种探针采集数据,收集关键指标,
同时搭配数据呈现和监控告警,能够解决上述的大部分问题。
然而随着 RPC 框架、微服务、云计算、大数据的发展,同时业务的规模和
深度相比过往也都增加了很多,一次业务可能横跨多个模块/服务/容器,依赖
的中间件也越来越多,其中任何一个节点出现异常,都可能导致业务出现波动
或者异常,这就导致服务质量监控和异常诊断/定位变得异常复杂,于是催生了
评论0
最新资源