【精品】服务亿级用户:移动运维大数据中台建设之路-19.9.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
【运维大数据中台建设】 运维大数据中台是现代企业应对亿级用户服务需求的关键基础设施,旨在通过数字化转型提升运维效率,降低成本,增加服务质量。在2019年的GOPS全球运维大会上,浙江移动分享了其在建设运维大数据中台过程中的实践经验。 1. **运维数字化转型的必要性** - **业务与IT融合**:随着业务和技术的深度融合,企业需要更加灵活和高效的IT架构来支持业务发展。 - **提升竞争力**:在“智能+”时代,通过数字化转型,企业可以提升自身在市场中的竞争力。 - **降本增效**:通过运维大数据中台,企业能够减少运维成本,提高运行效率,实现资源的最优配置。 - **政策驱动**:创新型国家建设和数字经济的快速发展,推动企业加快数字化进程。 2. **浙江移动IT架构演进** - **历史沿革**:浙江移动作为电信行业的先行者,经历了从传统的IT架构到云计算、微服务架构、AI的探索与实践。 - **技术进步**:逐步完成了核心系统的容器化、去IE化和微服务化,实现了运维工具和组织的转型。 3. **转型的挑战** - **稳定性下降**:单个网元的稳定性问题对整体服务质量构成威胁。 - **积累与投入不足**:相比互联网巨头,企业在IT积累和技术投入上相对较少。 - **多变因素**:大量网元、技术栈和应用系统的存在,以及频繁的技术演进和组织人员变动,增加了运维难度。 - **效率问题**:故障处理时间增长,影响运维人员的工作和生活质量。 4. **转型布局** - **工具转型**:从传统的ITIL、监控告警向自动化操作和AIOPS转变,提升运维效率和管理价值。 - **组织转型**:构建以AIOps为核心的数字化运营组织,实现运维团队的专业化和敏捷化。 - **理念转型**:提升运维视野,打造自顶向下的运维模式,以数据为基础,算法赋能,实现运营的数字化和能力的中台化。 5. **组织变革** - **职能分工**:设立了ANOC、SRE、BOE和CRE等角色,以应对业务连续性、应用连续性、云平台连续性等不同运维需求。 - **协同机制**:通过分层治理,全局视角,多维度技能,建立应急协同机制,确保故障的快速处理和系统的稳定运行。 6. **工具变革** - **从被动到主动再到智能**:从基于规则的运维进化到AIOPS,通过自动化工具和智能算法提升运维效率和准确性。 7. **AIOPS的实践与挑战** - **AIOPS非万能**:虽然AIOPS有巨大的潜力,但现阶段仍处于初级阶段,需要逐步引入,从辅助决策开始,逐渐过渡到智能决策和自愈管理。 - **场景选择**:选择合适的AIOPS应用场景,如智能变更、性能优化和故障管理,逐步提升自动化水平。 8. **AIOPS实施路径** - **智能引入路径**:从增强人(Augmentation)到人工智能操作(Artificial Intelligence Operation),逐步实现规则操作(Rule Operation)到智能决策(Decision Making)的升级。 - **效果评估**:通过五级标准衡量AIOPS的质量,从完全依赖人工到完全自动化的运维模式。 运维大数据中台的建设是企业面对亿级用户服务的重要策略,涉及到运维的数字化转型、组织和理念的转变,以及AIOPS的引入与实践。通过这些变革,企业可以应对复杂的运维挑战,提升服务质量,同时实现运维效率的显著提升。
剩余35页未读,继续阅读
- 粉丝: 421
- 资源: 315
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助