没有合适的资源?快使用搜索试试~ 我知道了~
IT自动化运维平台建设解决方案.ppt
4星 · 超过85%的资源 需积分: 0 73 下载量 102 浏览量
2022-04-29
20:08:22
上传
评论
收藏 4.35MB PPT 举报
温馨提示
试读
32页
IT自动化运维平台建设解决方案.ppt
资源详情
资源评论
资源推荐
IT 自动化运维平台建设解决方案
目 录
目 录
CONTENTS
CONTENTS
2
3
4
人工运维
人工运维
自动化运维
自动化运维
智能化运维
智能化运维
AIOps
AIOps
运维工作主要由人工完成,运维人员
负责机房、服务器选型、软硬件初始
化,服务上下线,配置监控,盯监控
等,基本上是遇到什么问题解决什么
问题。
自动化运维就是把周期性、重复性、规律
性的工作都交给工具去做,具体来说有应
用系统维护自动化,巡检自动化和故障处
理自动化这三个方面;
自动化运维依赖于管理平台,最可终达到
提升运维效率的目的。
AIOps 利用大数据和机器学习技术,
实现海量数据的异常检测和多维度关
联分析,它将增强或部分取代 ITOM
领域的三个重要能力,即监测,服务
管理和自动化;
进一步帮助 运维人员准确甄别系统
异常,快速定位故障根因,并对潜在
系统风险进行预警,以实现 IT 和业
务的持续洞察和改进。
当前
IT
运维的整体发展趋势是向自动化迭代,并向智能化演化;
目前大部分组织的
IT
运维正处在从人工运维向自动化运维的发展阶段;
有部分组织已经基本实现了自动化运维,正在向智能化运维升级,而也已有少量企
业已经构建了初步的智能化运维体系。
IT 运维的总体发展趋势
1
Part
运维现状及痛点
2
Part
承担了包括实体机、虚拟机、网络设备、数据库、中间件等 1.5 万台主机和数通设备的基础作业维护和应用故障维护工
作。目前通过 ZABBIX (监控) + 业务网管系统(告警)实现监控收集、上报、处理的闭环流程。具体流程如下:
发生告警
值维监控
运维工程师
研发工程师
告警恢复
zabbix
采集到的信息生成
告警
,
输出至业务网管
通过电话、微信方式通知
运维工程师处理
运维工程师分析处理,或
协调研发工程师处理
运维过程缺乏回溯:缺乏对运维操作过程的
管控。处理结果无痕迹,缺乏经验成果沉淀
。
日常运维缺乏自动化:缺乏自动周期性作业巡
检任务及故障处理脚本,日常维护作业依靠每
个运维工程师人为判断并执行脚本。
规范性
技术性
问题分析及解决思路
3
Part
1
2
3
周期性任务执行结果无法监控
周期性定时任务执行脚本和配置均由各运维工程师控
制,执行结果无法监控,无系统化的统一管理配置
告警处理过程缺少监控记录
现阶段由运维工程师对告警信息进行定位分析,根据
故障分析结果进行处理。无系统化的根因和经验沉淀
。若发生人员流动,告警无法处理无法进行平滑交接
被动式的告警处理方式,非工作时间告警处理无法
保证在第一时间被处理
非工作时间告警处理传报响应慢
构建自动化运维平台
1. 周期性任务统一管理:
将周期性的日常任务执行和配置通过自动化运维平台来统一管
理
2. 触发性任务实现自愈:
结合故障场景梳理和告警逻辑关联,实现对故障的自动
处理
3. 部分重要指标实现优化:
针对部分故障没有发生,但是场景已经恶化的指标,自
动进行优化处理。
解决
思路
剩余31页未读,继续阅读
优享智库
- 粉丝: 189
- 资源: 74
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论1