img
share 分享

VIP会员

作者:CSDN

出版社:CSDN《程序员》

ISBN:1111111111117

VIP会员免费 (仅需0.8元/天) ¥ 40000.0

温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!

电子书推荐

更多资源 展开

devops故障排除:linux服务器运维最佳实践 Kyle Rankin 评分:

devops是一组过程、方法与系统的统称,用于促进开发者、质量保证人员(qa)以及系统管理员之间的沟通、协作与整合。在devops团队中,虽然大家一直强调团队合作,但由于没有相同的故障排除技术,在遇到问题时,每个人往往限于自己的传统职责,要等到其他人诊断完成后方能开始工作。这样,尽管采用了devops原则,企业的效率也并不高.本书面向devops团队,通过系统讲解常见的linux故障排除技术,帮助开发者更准确地追踪系统负载加重的原因,让qa人员在产品发布前更好地诊断问题,系统管理员对自己的诊断更有把握。 《devops故障排除:linux服务器运维最佳实践》首先介绍了故障排除中要掌握的基本方法和原则,然后针对linux系统中的常见问题,逐个分析故障原因并给出故障排除方法,这些问题包括服务器运行缓慢、系统无法启动、不能写入磁盘、服务器宕机、主机名无法解析、web服务器宕机、数据库运行缓慢等,最后还简单介绍了常见的硬件问题。 《devops故障排除:linux服务器运维最佳实践》内容全面,结构清晰,适合开发者、qa人员和系统管理员学习参考。 作者简介 · · · · · · Kyle Rankin 高级系统管理员、DevOps开发工程师、美国北湾地区Linux用户组主席.他著有《The Official Ubuntu ServerBook》、《Knoppix Hacks》和《Ubuntu Hacks》等书,不仅是《Linux Journal》杂志享誉盛名的专栏作家,还是《PC Magazine》杂志、TechTarget网站等多家媒体的撰稿人。Rankin经常出席SCALE(南加州Linux展会)、OSCON(O'Reilly开源大会)、Linux World Expo、Penguicon以及一些 Linux用户组会议,并就开源软件发表演讲。 王东明 毕业于武汉大学,之后开始从事网络游戏服务器开发。先后开发过端游和页游服务器,现就职于某外企,从事游戏开发工作。业余时间喜欢技术类书籍翻译以及移动游戏开发。 王飞 拥有武汉大学学士学位,中国科学技术大学硕士学位。现就职于某国企互联网部,从事网络运维开发工作.对于Linux服务器运维有丰富的经验,对”大流量,高并发”的应用场景有着深刻的理解,擅长自动化运维工具的开发与使用,尤其是对报警相关流程的自动化有着独到的见解。 刘洁 拥有北京邮电大学硕士学位.资深Web开发工程师和系统工程师,现就职于某搜索公司,专注于计算广告系统和移动搜索算法研究相关工作,工程实践经验极为丰富。 目录 · · · · · · 译者序 前言 第1章 故障排除的最佳实践 1 1.1 划分问题空间 2 1.2 协同工作时的良好沟通 3 1.2.1 电话会议 3 1.2.2 直接对话 4 1.2.3 电子邮件 5 1.2.4 实时聊天室 6 1.2.5 备用沟通方法 7 1.3 首选快速、简单的测试,而不是缓慢、复杂的测试 7 1.4 多尝试过去的解决方案 8 1.5 记录问题和解决方案 9 1.6 了解改动 11 1.7 了解系统如何工作 12 1.8 谨慎使用internet 13 1.9 抵制重启 14 第2章章服务器为什么这么慢?耗尽了cpu、ram和磁盘i/o资源 15 2.1 系统负载 16 2.2 使用top命令解决负载问题 18 2.2.1 了解top命令的输出 19 2.2.2 解决高用户时间的问题 21 2.2.3 解决内存不足的问题 22 2.2.4 解决高i/o等待时间问题 24 2.3 问题发生后的高负载处理 27 2.3.1 配置sysstat 27 2.3.2 查看cpu统计信息 28 2.3.3 查看ram统计信息 29 2.3.4 查看磁盘统计信息 29 2.3.5 查看之前的统计信息 30 第3章 为什么系统无法启动?解决启动问题 32 3.1 linux启动流程 32 3.1.1 bios 33 3.1.2 grub和linux启动载入程序 33 3.1.3 内核与初始ram磁盘 35 3.1.4 /sbin/init 35 3.2 bios启动顺序 42 3.3 修复grub 43 3.3.1 没有grub提示 44 3.3.2 阶段1.5 grub提示 45 3.3.3 配置错误的grub提示 46 3.3.4 从活动系统中修复grub 46 3.3.5 通过恢复磁盘修复grub 47 3.4 禁止启动界面 47 3.5 无法挂载根文件系统 48 3.5.1 根内核参数 48 3.5.2 根设备更改 49 3.5.3 根分区损坏或失效 52 3.6 无法挂载二级文件系统 52 第4章章为什么磁盘无法写入?解决磁盘满或者磁盘损坏的问题 53 4.1 磁盘满 53 4.1.1 保留区块 54 4.1.2 找到占用空间最大的目录 55 4.2 节点不足 57 4.3 文件系统只读 58 4.4 修复损坏的文件系统 58 4.5 修复软raid 60 第5章 服务器宕机了?追踪网络问题的根源 63 5.1 服务器a不能和服务器b通信 64 5.1.1 客户端或者服务器问题 64 5.1.2 链路接通了吗 64 5.1.3 接口是否启用 66 5.1.4 是否连通本地网络 66 5.1.5 dns是否工作正常 68 5.1.6 是否可以路由到远程主机 70 5.1.7 远程端口是否开放 71 5.1.8 在本地测试远端主机 72 5.2 网络速度较慢的故障排除 74 5.2.1 dns的问题 74 5.2.2 通过traceroute查找网络缓慢的原因 75 5.2.3 使用iftop查看带宽使用情况 76 5.3 抓取数据包 79 5.3.1 使用tcpdump 80 5.3.2 使用wireshark 83 第6章 为什么主机名无法解析?解决dns服务器的问题 87 6.1 dns客户端故障排除 88 6.1.1 未配置名称服务器或者无法访问名称服务器 89 6.1.2 丢失查询路径或者名称服务器问题 91 6.2 dns服务器故障排除 91 6.2.1 了解dig的输出 92 6.2.2 跟踪dns查询 95 6.2.3 递归名称服务器的问题 97 6.2.4 什么情况下没有执行更新 101 第7章 为什么无法收发邮件?追踪邮件问题 112 7.1 追踪邮件请求 113 7.2 了解邮件头信息 116 7.3 邮件发送的问题 118 7.3.1 客户端无法与外部邮件服务器通信 119 7.3.2 出站邮件服务器不允许转发 123 7.3.3 出站邮件服务器无法与目标服务器通信 124 7.4 接收邮件的问题 127 7.4.1 telnet测试无法连接 129 7.4.2 telnet可以连接,但消息却被拒绝了 130 7.4.3 研究邮件日志 130 第8章 网站宕机了?追踪web服务器问题 133 8.1 服务器是否正在运行 134 8.1.1 远程端口是否开放 134 8.1.2 在本地测试远程主机 135 8.2 使用命令行测试web服务器 137 8.2.1 使用curl测试web服务器 137 8.2.2 使用telnet测试web服务器 139 8.3 http状态码 141 8.3.1 1××信息状态码 141 8.3.2 2××成功状态码 141 8.3.3 3××重定向状态码 142 8.3.4 4××客户端错误状态码 143 8.3.5 5××服务器错误状态码 144 8.4 分析web服务器的日志 145 8.5 获取web服务器统计数据 149 8.6 解决常见的web服务器问题 154 8.6.1 配置问题 154 8.6.2 权限问题 155 8.6.3 web服务器性能迟缓或不可用 157 第9章 为什么数据库这么慢?追踪数据库问题 161 9.1 查找数据库日志 162 9.1.1 mysql 162 9.1.2 postgressql 162 9.2 数据库还在运行吗 163 9.2.1 mysql 164 9.2.2 postgressql 165 9.3 获得数据库度量值 166 9.3.1 mysql 166 9.3.2 postgressql 168 9.4 识别查询缓慢的问题 171 9.4.1 mysql 171 9.4.2 postgressql 173 第10章 这是硬件问题!诊断常见的硬件问题 174 10.1 硬盘驱动器无法工作 175 10.2 测试内存错误 178 10.3 网卡故障 180 10.4 服务器过热 181 10.5 电源供电故障 183 ↑折 叠 译者序 在日常工作中,我们经常会碰到一些运维相关的问题。当服务器出现问题时,开发人员一般都束手无策,要等运维人员解决问题才能继续工作。而运维人员在解决问题的过程中,又有可能需要开发人员的协助,但由于开发人员一般对运维技术知之甚少,不但合作效率低下,而且可能产生摩擦。 通过阅读本书,开发人员可以融入到DevOps的开发环境中,加强与运维人员的合作,从而大幅提高解决问题的速度和效率。对于系统管理员和其他运维人员来说,本书也提供了一些进阶知识,可以用来扩展知识面。无论是开发人员还是运维人员,阅读本书之后,都能掌握一致的故障排除技术,这样当服务器出现问题时,就能够顺畅地沟通,团结协作,更有效率地解决问题。 本书由浅入深,层次分明,首先介绍了贯穿本书的故障排除中要掌握的基本方法和原则,然后从服务器的启动开始讲起,再过渡到常用服务器的故障排除技术,最后还简单介绍了常见的硬件问题。书中介绍的方法与技术都相当简单、实用,操作性很强,读者既可以在碰到问题时,把本书当做工具书,查阅相关内容;也可以在闲暇时通读本书,更好地了解Linux服务器故障排除的种种标准方法。 DevOps方法近年在国内慢慢开始流行,但相关中文书籍并不多,能够翻译这样一本优秀的书我深感荣幸。本书的翻译过程颇费周折,感谢编辑关敏女士,她的大力支持使本书得以顺利完成。由于译者水平有限,难免有所疏漏,敬请广大读者批评指正,共同进步。

...展开详情
上传时间:2016-03 大小:54.48MB
热门图书