没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
ECS 是当前阿里云的核心产品,又是很多云服务的基座产
品,随着集团内部上云,越来越多的应用和服务构建在 ECS
之上,而针对使用 ECS 的阿里云用户提交的售后问题也是多
而广,为了更好地服务用户,并使得越来越多的用户能够“自
助”了解 ECS 系统问题诊断的方法,阿里云全球技术支持中
心 GTS 的 ECS 系统售后团队根据多年的丰富排查经验,总
结并选取出一些可以抛砖引玉的处理思路和方案,希望可以
“四两拨千斤”。
前言
Linux 启动与登录问题 5
超详细系统启动与登陆异常排查点 5
grub.conf 文件内容被清空了怎么办 11
巧妙利用 strace 查找丢失的文件 13
小心 PAM 不让你登录 15
CentOS 登录卡住的原因被我找到了 16
Linux 性能问题 18
找到 Linux 虚机 Load 高的“元凶” 18
OOMkiller 是被谁触发的 24
我的服务器内存去哪儿了 32
CPU 占用不高但网络性能很差的一个原因 37
一次 IO 异常捕获过程 46
Linux 主机网络问题 50
ifdownifup命令丢失处理 50
网络不通? strace 二度出手 52
TIME_WAIT&CLOSE_WAIT 的讨论总结 57
一次网络抖动经典案例分析 65
Linux 系统服务与参数问题 70
4 个 limits 生效的问题 70
6 步排查 ss&netstat统计结果不一样的原因 75
为什么明明内存很充足但是 java 程序仍申请不到内存 78
请不要忽略 min_free_kbytes 的设置 86
最后的彩蛋 89
某地区口罩项目架构演进及优化经验 89
目录
Linux 启动与登录问题
Linux启动与登录问题是 ECS 的高频问题,而往往处理不及时会直接影响到
用户业务的正常可持续运行,因此也变成了我们处理问题优先级的重中之重。
在云环境上影响 ECS 启动与登录的因素非常多,镜像、管控、虚拟化、底层
硬件、系统与文件异常等等,本文仅从系统与文件本身角度,在大量处理经验
的基础上,归纳总结了一些可能会引起系统启动与登录问题的排查点,并给出
几个比较常见的典型案例来具体展示和说明。
超详细系统启动与登陆异常排查点
系统启动异常
1. 部分 CentOS 系统启动黑屏,无异常报错的场景,可以 fsck 一下系统盘。
2. 根分区空间满,以及 inode 数量耗尽。
3. 升级内核或者从老的共享实例迁移到独享规格导致的启动异常。
3.1 手动注入驱动(mkinitrdvirtio 相关驱动 )。
3.2 修改 grub的启动顺序,优先尝试使用老内核启动。
3.3 /boot 目录下面内核的关联文件是否全(下面仅为 demo,不同系统内核版
本文件不一致,部分内核版本 boot 下的 i386 目录也是有用的)。
6 > 超详细系统启动与登陆异常排查点
config-4.9.0-7-amd64
initrd.img-4.9.0-7-amd64
System.map-4.9.0-7-amd64
vmlinuz-4.9.0-7-amd64
3.4 /boot/grub/device.map 里面的 hda 改成 vda。
4. fstab/grub 中的uuid 不对,可以直接修改为 /dev/vda1 这种形式尝试。
数据盘分区异常加载起不来的场景,可以去注释 fstab 所有的行,添加类似下面
的启动项尝试,也适用于系统盘快照创建云盘挂载后,uuid 一致导致的启动异
常,改成非 UUID 的挂载即可。
/dev/vda1 / ext4 defaults 1 1
5. 根目录权限 777(部分目录 777)也会导致启动异常,或者 ssh 登陆异常。
可参考下面的文章仅限修复尝试。
https://yq.aliyun.com/articles/761371
6. 常见的关键目录缺失,有的是软链,也可以看看对应目录下面的文件数量(文件
数量要跟同内核版本或者相差不大的版本对比),简单判断。
/bin /sbin /lib /lib32 /lib64 /etc /boot /usr/bin /usr/sbin /usr/lib /
usr/lib64 等目录或文件缺失
for i in /bin /sbin /lib /lib32 /lib64 /etc /boot /usr/bin /usr/sbin /
usr/lib /usr/lib64 ;do ls -l $i |wc -l ;done
7. 影响启动的参数。
如果参数设置不当,是会导致启动异常的,如 /etc/sysctl.conf 以及检查 rc.local
的配置,profile 的检查。
vm.nr_hugepages
vm.min_free_kbytes
超详细系统启动与登陆异常排查点 < 7
8. CentOS 的 selinux 需要关闭。
# cat /etc/selinux/config
# This file controls the state of SELinux on the system.
# SELINUX= can take one of these three values:
# enforcing - SELinux security policy is enforced.
# permissive - SELinux prints warnings instead of enforcing.
# disabled - No SELinux policy is loaded.
SELINUX=disabled 把这一行改成 disabled
# SELINUXTYPE= can take one of three values:
# targeted - Targeted processes are protected,
# minimum - Modification of targeted policy. Only selected processes
are protected.
# mls - Multi Level Security protection.
SELINUXTYPE=targeted
root 登录异常
1. /etc/passwd/etc/shadow( 用户名rootpoliktdbus 等关键用户存在与否,文
件为空,格式乱(dos2unix)。
2. /etc/pam.d目录下是否有为空的文件及参数设置是否正常,如常见的sys-
tem-authpasswd。
3. /etc/pam.d下面所有文件里面涉及的 so 文件,看看文件是否存在,是否为空/
usr/lib64/security。
4. 查 /etc/lib64/bin/sbin/usr/bin/usr/sbin 等目录有没有 size 为 0 的文件。
5. /etc/profile/etc/profile.d( 打 印 列 表 )/etc/bashrc/root/.bash_profile/root/.
bashrc等涉及登陆环境设置的文件是否异常。
6. 注意内核版本,是否存在新老内核,多更换几个内核试下。
7. 系统日志也是一个比较重要的检查项(后面会介绍无法登陆怎么检查)。
8. Ubuntu12.04 登陆异常 在 /etc/login.defs 里面配置了错误的 ERASECHAR
导致,恢复默认 0177 即可。
剩余92页未读,继续阅读
资源评论
- snailtrace2023-05-24资源有一定的参考价值,与资源描述一致,很实用,能够借鉴的部分挺多的,值得下载。
小鸭文库
- 粉丝: 141
- 资源: 5901
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- MyBatis 动态 SQL:灵活而强大的查询构建器.pdf
- com.accordion.prettyo.apk
- 毕业设计:基于SSM的mysql-ssm软件bug管理系统(源码 + 数据库 + 说明文档)
- MTSQL8.0.35windows(64bit)-mysql-installer-community-8.0.35.0
- 人工智能引领音乐创作新时代之Suno AI
- Public-bicycle-usage-forecast-master.zip
- 通道处理过程模拟:从理论到实践.pdf
- 数据库第七次作业E-R图第一题
- 大厂面试真题Java语法基础面试专题及答案
- IMG20240428211124.jpg
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功