FinTech 时代,全球范围内的社会形态、商业生态和客户行
为发生深刻变化,科技赋能效应日益明显。 IT 系统已经从支撑
工具逐步演进为核心竞争优势。如何借助以云计算、大数据等为
代表的新兴技术夯实运维基础;如何打造高效能、高可用、低风
险运维系统,为业务提供持续支撑;如何保证信息系统安全稳定
运行,优化 IT 资源环境的性能?这些都是 IT 运维管理所面临的
新问题。面对不断涌现的运维新挑战,业界认为智能化将是运维
管理的发展方向。
近年来,运维管理经历了从手工运维到 ITOM(IT 运维管理),
进而逐步向 AIOps(IT 智能运维)迈进的过程,体现了运维技术从
数字化、自动化到智能化的发展趋势。业界提出的 AIOps 运维概
念,期望在 ITOM 基础上,运用机器学习与人工智能技术,从系统的
行为、事件、故障和趋势等维度,对 IT 系统运行状态进行深度监
控、趋势分析、智能决策,从而提升运维管理能力,为 IT 运维提供
全新的管理思路。AIOps 典型场景包括但不限于如下四方面。
1.资源优化。资源优化包括阈值动态调整、资源与性能优化等
运维场景。传统的运维管理平台一般采用静态阈值。然而,静态阈
值往往是根据人的经验设定。阈值动态调整通过自主学习系统运行
情况,结合运维人员的经验,自动调整各阈值。资源与性能优化通
过全面监测系统运行情况,运用智能算法挖掘系统运行规律,定位