【AIX服务器检查命令详解】
AIX服务器的检查是一个关键环节,确保系统稳定运行和高效性能。本篇将详细介绍在AIX系统中进行服务器检查所涉及的各项命令。
检查环境条件是必要的,包括机房的温度和湿度。理想温度范围是10℃到40℃,湿度应在8%到80%之间。这些参数对于硬件的正常工作至关重要。
电源检测也是不可忽视的。零地电压应小于1V,火地电压应保持在200-240V。对于某些特定型号如59系列,相间电压为380V,相地电压为240V。
硬件错误报告是检查服务器健康状况的重要工具。使用`errpt -dH`和`errpt -dS`命令查看硬件和软件的永久性错误报告。报警灯的状态也需留意,异常时可能预示着潜在问题。
了解服务器的基本信息,包括机器序列号(`uname -Mu`)和操作系统版本(`oslevel -r`)。有些命令可能因系统版本较低而无法执行,所以升级系统也是必要的维护步骤。
系统运行状态的检查涉及多个方面:
1. 使用`sysdumpdev – l`确认dump设置为"always allow sysdump"。
2. `sysdumpdev – e`检查dump大小是否合适,不应超过主dump设备大小的80%。
3. `lsvg -l rootvg`检查逻辑卷是否存在"stale"状态。
4. `lsps -s`监控内存交换区占用情况。
5. `df – k`查看文件系统分配情况,避免超过80%的使用率。
6. `lsdev – Ccdisk`、`lsdev – Ccadapter`、`lsdev – Cctape`、`lsdev – Ccprocessor`分别检查硬盘、PCI卡、磁带机和CPU的状态。
7. `lsattr – El sys0|grep autorestart`和`lsattr – El sys0|grep cpuguard`检查系统崩溃后的重启设置和CPU GUARD状态。
8. `lsattr – El mem0`确认内存状态正常,`size=goodsize`。
9. 使用`vmstat`、`iostat`、`topas`分析系统负载、内存利用率和磁盘I/O,识别性能瓶颈。
10. `netstat – in`和`netstat – rn`检查网络接口和路由状态。
11. `entstat – d enX`验证网卡速度与交换机匹配,并注意更改速率可能影响默认路由。
12. `ping`命令用于检查网络连接。
13. `lsdev – C|grep aio`确认异步IO可用性。
14. `lssrc – g cluster`和`/usr/sbin/cluster/clstat – a`检查集群服务的运行状态。
15. 日志文件检查,例如`/etc/hosts`、`/usr/es/adm/cluster.log`、`/usr/es/sbin/cluster/history/*`和`/tmp/hacmp.out`,寻找错误或失败记录。
16. 7133磁盘阵列的检查,如`smitty ssaraid`系列命令,监控RAID状态和热备磁盘。
针对华为和IBM联合巡检,还需关注CPU频率、磁盘数量、网卡信息等。例如,通过`lsattr -El proc0`查看CPU频率,`lsdev -Ccdisk`计数内置磁盘,`lsdev – Ccadapter`获取网卡信息。
以上即为AIX服务器检查的主要命令和流程,全面且详尽的检查有助于预防潜在故障,确保系统的稳定性和高效率。