IBM P系列小型机故障的基本定位.pdf
### IBM P系列小型机故障的基本定位 #### 一、故障的定义 在处理IBM P系列小型机故障时,首先需要明确“故障”的定义。这里提到的“故障”是指系统运行过程中遇到的问题,这些问题可能导致系统无法正常工作或者部分功能失效。为了更准确地定位故障,我们需要收集一系列相关信息: 1. **系统现状**:确定系统当前能够执行的操作以及无法执行的操作。 2. **故障发生时间**:了解故障首次出现的时间点。 3. **操作差异性**:是否有进行过与平时不同的操作导致故障的发生。 4. **故障规律性**:判断故障是定时出现还是随机出现,并评估其出现的频率。 5. **受影响范围**:确定是一台机器出现问题还是多台机器均受到影响,以及这些机器的故障现象是否一致。 6. **近期改动情况**:检查最近是否对系统进行了硬件或软件的安装、更新或是对系统配置进行了调整。 #### 二、故障信息的收集 收集故障信息对于诊断故障原因至关重要,以下是具体的步骤和方法: 1. **系统故障记录(errorlog)**: - **errdemon进程**:该进程会在系统启动时自动运行,负责记录系统中的各种错误信息,包括硬件、软件以及其他操作信息。 - **故障记录文件**:所有错误记录会被保存在`/var/adm/ras/errlog`文件中,可以将此文件备份或拷贝到其他计算机上进行进一步分析。 - **errpt命令**:这是一个非常实用的命令,即使普通用户也有权限使用它来查看系统的错误日志。通过`#errpt | more`命令可以列出简短的错误信息,包括错误ID、时间戳、类型、资源名称和错误描述等关键字段。 - **示例输出**: ``` ERROR_ID TIMESTAMP TC RESOURCE_NAME ERROR_DESCRIPTION 192AC071 0723100300 T0 errdemon Error logging turned off 0E017ED1 0720131000 PH mem2 Memory failure 9DBCFDEE 0701000000 T0 errdemon Error logging turned on 038F2580 0624131000 UH scdisk0 UNDETERMINED ERROR AA8AB241 0405130900 TO OPERATOR OPERATOR NOTIFICATION TIMESTAMP: MMDDHHMMYY (月日时分年) ``` - **高级查询**:可以通过以下命令进一步过滤和查询错误日志: - `#errpt -d H`:列出所有硬件相关的错误信息。 - `#errpt -d S`:列出所有软件相关的错误信息。 - `#errpt -aj ERROR_ID`:通过指定错误ID来获取详细的错误信息。 - `#errpt -aj 0502f666`:查询特定错误ID(大小写不敏感)的详细信息。 - 示例输出(针对特定错误ID的详细信息): ``` LABEL: SCSI_ERR1 ID: 0502F666 Date/Time: Jun 19 22:29:51 Sequence Number: 95 Machine ID: 123456789012 Node ID: host1 Class: H Type: PERM Resource Name: scsi0 Resource Class: adapter Resource Type: hscsi Location: 00-08 VPD: <--- Virtual Product Data Device Driver Level 00 Diagnostic Level 00 Displayable Message SCSI EC Level .. C25928 FRU Number 30F8834 Manufacturer . IBM 97F Part Number .. 59F4566 Serial Number 00002849 ROS Level and ID 24 Read/Write Register Ptr .. 0120 Description ADAPTER ERROR Probable Causes ADAPTER HARDWARE CABLE CABLE TERMINATOR DEVICE Failure Causes ADAPTER CABLE LOOSE OR DEFECTIVE Recommended Actions PERFORM PROBLEM DETERMINATION PROCEDURES CHECK CABLE AND ITS CONNECTIONS Detail Data SENSE DATA 000000000000000000000000000000000000000000000000 ``` 2. **控制面板上的LED代码**: - **8位代码**:通常表示系统级别的故障,系统故障灯会亮起,并可能显示故障设备的位置代码。参考系统服务手册以获得更多信息。 - **4位代码**:形式为Exxx,同样需要查阅服务手册了解详情。 - **3位代码**:形式为0yyy,仅需关注最后三位数字。参考系统诊断手册获取详细信息。 - **特殊代码**:闪动的888表示系统崩溃,可能是由硬件或软件问题引起的。按下reset键可能会显示更多内容。例如,888-102通常表示软件故障,但888-102-207是个例外。此时系统会生成一个dump文件。 - **常见代码解读**: - **888-102-xxx-0C9**:系统正在生成dump文件,请耐心等待。 - **888-102-xxx-0C0**:dump文件生成完成,可以关闭电源并重新启动系统。 - **888-103或105**:通常表示硬件故障,伴有SRN代码和位置代码。 3. **SMS(System Management Service)故障记录**: - **进入SMS菜单**:当主控台出现键盘图标时(LED显示E1F1),按1键进入。 - **查看错误日志**:选择"Utilities"选项,然后选择"Error Log",记录下8位故障代码。 - **其他功能**:在SMS菜单中还可以更改系统启动顺序等设置。 通过以上信息的收集和分析,我们可以更有效地诊断和解决问题,确保IBM P系列小型机稳定高效地运行。
剩余18页未读,继续阅读
- 粉丝: 2
- 资源: 22
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 一个快速而强大的Python图形用户界面工具包,具有最小的依赖关系.zip
- 一个面向人类的跨平台GUI自动化Python模块,用于以编程方式控制鼠标键盘.zip
- 一个轻量级的面向对象的Python有限状态机实现,带有许多扩展.zip
- 一个命令行工具和带有Python绑定的Rust库,用于从用户提供的测试用例生成正则表达式.zip
- 一个全功能的可编程平铺窗口管理器,用Python X11 Wayland编写和配置.zip
- 一个社区维护的Python框架,用于创建数学动画.zip
- 一个用Python编写的高级Twitter抓取OSINT工具,它不使用Twitter的API,允许你抓取用户的关注者,.zip
- 一个小的Python库,用于制作简单的电子类HTMLJS GUI应用程序.zip
- 使用Python结合OpenCV和pyzbar库批量自动识别条码项目资源
- 三菱FX1N通讯E700变频器示例资料 硬件:fx1n-485bd板,fx1n plc,E700变频器一台 功能:控制功能包括正反转,停止,频率给定,读取动作包括运行频率,运行状态 百度网盘发,发
- No.865 基于S7-200 PLC和组态王智能交通灯控制系统 带解释的梯形图程序,接线图原理图图纸,io分配,组态画面
- NPC,三电平,三电平变器,三电平逆变器,NPC,中点电位平衡控制,三电平SVPWM
- AEB-自动紧急制动系统 AEB 主动制动 紧急制动 避障系统 CCRS CCRM CCRB 包含三种工况-前方静止 前方匀速 前方减速 车辆行驶过程中,利用主动制动的方式躲避前方障碍物 主要利用
- Comsol超材料S参数反演等效参数 负折射率超材料等效折射率、阻抗、介电常数与磁导率求解
- 基于51单片机设计恒温水箱控制程序仿真加热棒PID算法闭环 采用LCD1602时显示温度值及目标值,温度测量范围0~99.9℃,精度±0.1℃; 通过DS18B20温度传感器采集温度作为输入,PID算
- 滚动多机最优潮流,采用LDW-pso优化算法求解纯交流电网多机系统发电机时序最优出力,达到降低电网损耗最低的目的 优化算法可做PSOt LDW-PSO 以及GAOT对比,也可做选择,目标函数可选择