没有合适的资源?快使用搜索试试~ 我知道了~
机房类运维服务方案.doc
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 183 浏览量
2021-10-11
15:00:36
上传
评论
收藏 296KB DOC 举报
温馨提示
试读
40页
机房类运维服务方案.doc
资源推荐
资源详情
资源评论
- .
效劳方案
一、总体维护效劳方案
1、预防性检查
1.1 巡检时间
每月 1 日工作日上午 9 点
1.2、巡检地点
计算机机房
1.3、巡检目的
进展机房检查,对机房设备及供电系统、UPS 系统、精细空调系统、网络设备等设备进展检查,
及时发现设备隐患,排除故障。
1.4、巡检要求
1.4. 1.巡检期间,进展状态检查,假设发现问题,如计算机机房物理环境异常、精细空调异常、
UPS 及配电系统异常等,应按照应急预案及操作流程进展处理。
〔1〕电源、UPS:检查机房供电状况,UPS 工作情况、指示状态。检查 UPS 蓄电池使用状态,确
保蓄电池无松动。并使用温度枪进展检测物理温度。确保配电柜及 UPS、蓄电池无温度过高现象。
〔2〕机房环境:检查机房卫生状况及物理环境。
〔3〕机房温度:检查温湿度,将温湿度控制在一定围。温度:22℃±5℃,湿度≤60%.
〔4〕机房空调:空调运行状态、空调部有无漏水现象、空调噪音、空调风量等。〔 5〕机房照明:
机房照明系统是否正常,有无异常状况。
〔6〕机房 PDU:PDU 市电或 UPS 是否正常,使用温度枪进展检测外部物理温度。
〔7〕机房整体:检查机房其余设备运行状态,有无报警及指示灯异常状态。
1.4. 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境〔动力、空调〕故障、关键
的设备、网络、系统、效劳如无法及时恢复时,应立即通知甲方相关领导,由相关领导协调资源进
展故障处理。
1.4.3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。
1.5、计算机机房现场管理要求
1.除工作人员外,其他工作人员进出机房,需签字前方可进入,同时计算机机房人员要在现场,
检查监视其人员工作,防止其他人员未经授权擅自接触机房物理设备。
2.机房的机柜、线缆、设备等的标签管理;
- . 可修编.
- .
3.机房环境清理。
1.6 检查容列表
工程 性能检查容 脆弱性检查容
空调系统
高压压力、低压压力〔风冷系统〕,冷
冻水压力、温度,冷却水压力、温度
〔水冷系统〕,风机运行情况,滤网、
机排水系统、灰尘情况等。
机房热点情况、室机漏水检
查、室外风机运转情况、加湿
罐阳极棒检查、过滤网检查
等。
供配电系统
输入输出功率,输入输出电流、断路开
关、接地电阻、零序电流、器件发热情
况等。
导线、器件发热情况,断路开
关、防浪涌器件情况等。
UPS 系统
负载功率情况、器件发热情况、电池情
况〔外观、液位、接线柱〕等。
器件、导线发热情况,电池放
电时间等。
平安系统
录像备份管理、出入机房登记、器件灵
敏度、画面清晰度〔不同照度情况
下〕、云台运行等。
器件灵敏度、监控死角问题
等。
设备运行
机房环境
查看设备运行指示灯、机房照明运行情
况、机房环境
设备运行是否有报警情况、照
明是否正常、机房卫生是否整
洁等
2、现场故障维修
巡检过程中,如有发现设备及环境系统有故障状态,需进展记录并恢复故障状态。如不能立即恢复
故障状态,那么需进展应急预案处理。具体如下:
2.1 环境故障:卫生、温湿度、照明。〔四级故障〕
2.2 交换机故障:交换机蜂鸣,交换机启动不正常,指示灯异常。〔三级故障〕
2.3 空调故障:空调压缩机故障、空调冷凝水故障、空调漏水故障、空调制冷故障、空调加湿器故
障等。〔二级故障
2.4 UPS 故障:UPS 逆变故障、UPS 旁路、UPS 蓄电池温度、UPS 蓄电池外观鼓包现象、UPS 蜂
鸣报警等〔一级故障〕
2.5 配电柜故障:配电柜温度过高、配电柜打火现象等。〔一级故障〕
在解决故障时,最大限度做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,
- . 可修编.
- .
业务系统不能运转〞的故障级别,如果不能于 30 分钟解决故障,应立即提出应急方案,确保业务
系统的运行。故障解决后 24 小时,提交故障处理报告。说明故障种类、故障原因、故障解决中使
用的方法及故障损失等情况。故障类型、级别及相应标准列表:
故障级别 响应时间
故障解决
时间
I 级:属于紧急问题;其具表达象为:机房出现电力
事故等意外情况导致业务停顿、UPS 系统崩溃导致
业务停顿、空调系统崩溃导致业务停顿。
立即响应,5
分钟人员抵
达现场,30 分钟恢复业务
使用,2 小时提交故障处
理方案。
12 小时以
II 级:属于严重问题;其具表达象为:
出现局部部件失效、系统性能下降但能正常运行,
不影响正常业务运作。
立即响应,5 分钟抵达现
场,1 小时提交故障处理
方案
24 小时以
III 级:属于较严重问题;其具表达象为:出现系统
报错或警告,但业务系统能继续运行且性能不受影
响。
立即响应,5 分钟抵达现
场,2 小时提交故障处理
方案
48 小时以
IV 级:属于普通问题;其具表达象为:系统技术功
能、安装或配置咨询。
立即响应,30 分钟抵达现
场,2 小时提交故障处理
方案
3 天
3、后台故障维修
后台故障状态维修,需要在甲方允许的情况下,对设备进展维护及维修。
3.1 质保期的设备由我方查找故障原因并填写故障申请单,交由甲方进展协调处理,并协助甲
方进展故障排除及维修。如需联系厂商,那么由我方负责。
3.2 三级及四级故障状态,我方可自行进展维护和维修的设备,报由甲方同意后,我方自行进
展设备维修,更换零配件部件等,并将维修记录保存文档交由甲方及我方双方管理。 3.3 质保
期外的设备出现故障,那么由我方统一进展维修,费用由我方负责。并将维修记录报由甲方确认
并存档。
3.4 设备更换
- . 可修编.
- .
对于无法修复的设备,在合同有效期,经甲方审核,由乙方负责整体更换同型号或类似型号的产品
无法维修的设备交由甲方。
4、资产管理
4.1 对硬件设备型号、数量、版本等信息统计记录
4.2 对软件产品型号、版本和补丁等信息统计记录
4.3 对机房设施设备连接统计记录
4.4 对综合布线系统构造图的绘制
4.5 对机房更换设备连接统计记录
4.6 每月向甲方上报低值易耗品记录,包括仓库存储情况、耗材使用情况。
4.7 机房更新及更换设备的统计
4.8 机房维护设备及备品备件的管理及记录
5、应急处理
随着网络信息化建立的不断深入,加强机房各类设备、系统以及信息与网络平安等方面应对突
发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房平安与稳定,以保证正常
运行为宗旨,按照“预防为主,积极处置〞的原那么,本着建立一个有效处置突发事件,建立统一
指挥、职责明确运转有序、反响迅速处置有力的机房平安体系的目标,将正在发生或已发生事故的
损害程度减轻到最低,确保员工平安,特制定本应急处置预案。
本预案共分为应用系统故障应急流程和机房突发事件应急流程
系统故障应急流程
一、系统故障应急流程说明
1、故障发生
系统运维效劳小组可从以下途径得知故障的发生:
1.1、运维效劳中心通过网管告警发现故障
1.2、维护站点通过维护巡检发现故障
1.3、用户发现故障,报给呼叫中心
1.4、驻场工程师发现故障
2、报障受理
监控系统运维效劳小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障
情况。
3、信息研判
- . 可修编.
- .
运维效劳小组根据了解到的系统故障情况进展分析判断,以确定采用一般故障处理流程还是立
即启动系统突发故障应急处理预案。
4、预案启动
如需启动应急预案,那么立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对
系统突发故障应急事件进展全面管控处理。
5、资源确认
系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备
品备件等情况对相关资源〔主要是参与人员〕依据经历进展调度和确认,主要有以下资源:
我公司技术支持人员;
相关厂家技术支持人员;
我公司聘请的技术专家
6、预案执行
按照既定的预案进展突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。
7、预案终止
预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后
报系统突发故障应急领导小组决定。
8、结果上报
预案中止后,相关预案参与人员将整个事件过程中的经历和教训,修改、完善事件应急预案。
然后集中上报至系统突发故障应急领导小组。
二、系统故障应急处理流程图
- . 可修编.
剩余39页未读,继续阅读
资源评论
wsbhm62
- 粉丝: 7
- 资源: 21万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功