【摘 要】为了建设和运营一个高效的数据中心,通过分析当前基地运维管理面临的挑战,结
合当前数据中心运维管理工具的发展趋势,从运维管理平台的系统架构、组织架构、技术构
架、组网结构等方面详细介绍了大型数据中心一体化运维管理平台的建设模式,从而实现智
能化运维的管理目标,减少运维成本并提升运维效率。
【关键词】大型数据中心 智能化运维 一体化运维 云化架构
doi:10.3969/j.issn.1006-1010.2016.14.014 中图分类号:tn929.5 文献标志码:a 文
章编号:1006-1010(2016)14-0066-05
引用格式:邓颂清,程尧. 大型数据中心一体化运维管理平台的建设模式研究[j]. 移动
通信, 2016,40(14): 66-70.
large data center intelligent operation and maintenance integrated operation and
maintenance
1 引言
随着移动互联网、大数据、云计算的飞速发展,全国各地数据中心的规模迅速扩张,如
何建设和运营一个高效的数据中心,是数据中心管理人员的重大挑战[1]。
dcim(data center infrastructure management,数据中心基础设施管理)是近年兴起
的数据中心基础设施管理工具,不同的机构有不同的解读。本文在 dcim 的理念基础上,针对
大型数据中心(即在全国各地拥有多个基地的大型数据中心),就其一体化运维管理的建设模
式提出探讨性方案。
2 基地运维面临的挑战与趋势
数据中心运维管理的主要目的是保障基础设施的可用性及降低风险,提高资产的利用率,
降低能耗消耗和运维成本,提高服务水平以及数据中心的效率和效益[2]。
作为承载信息系统运行的数据中心,运维管理的关键是对it 设备以及支撑 it 设备运行
的风火水电等场地基础设施的管理,包括:对这些基础设施的日常监控和维护;对这些设备
进行全生命周期的管理;运维业务管理的流程与规则;对数据中心内基础设施日常运行数据
的分析、对比与挖掘。
对于大型数据中心产业基地,特征为辐射全国、规模分布、虚拟资源、弹性调度、安全
防护、绿色节能。随着数据中心的发展,功能需求越来越多,管理的规模越来越大,系统间
的数据交互越来越广,系统对接口的复杂度急剧上升。由于业务、维护复杂,对管理系统的
要求也更高。
现阶段大型数据中心运维面临的挑战如下:
(1)经济性:资源如何有效利用,包括网络、空间、动环资源;如何缩减运行费用,包
括能源、维护人员。
(2)灵活性:如何识别及降低过度部署和冗余;如何灵活扩展容量(空间、制冷和供电);
如何更快响应业务。
(3)可用性:如何实现精细化管理;如何及时排除隐患,处理复杂故障;如何实现动态
资源管理和电子流管理。
(4)管理性:需要有效的数据分析支撑决策和规划;如何实现系统一体化,统一协作、
快速响应;如何满足大客户 sla(service-level agreement,服务等级协议)和自服务管理。
面对以上挑战,数据中心应建设“集中化运维、一体化管理、智能化分析、流程化控制”
的 it 支撑系统,才能实现智能化运维的管理目标,减少运维人员和维护成本,优化资源管理,
提升运维效率。
3 平台系统架构、组织架构和技术架构
3.1 平台系统架构