没有合适的资源?快使用搜索试试~ 我知道了~
zabbix基础文档
资源推荐
资源详情
资源评论
我们的⽣活⾥,离不开监控,监控能够最⼤程度上,发挥如下作⽤
实时监测,即使你不在电脑前,也能实时掌握监控区域情况,提⾼⼯作效率
事后录像查询,如果不法事件未能即使发现制⽌,可以调取录像,让不法分⼦⽆处遁形。
给与不法分⼦震慑作⽤,当不法分⼦意识到⾃⼰暴露在监控内,就不敢使坏。
远程查看,远程操控,只需要联⽹,即可在任何设备上,试试查看监控。
服务器监控
为什么会有监控
运维的职责
在有监控系统之前,运维⼈员需要登录服务器⼿动敲打命令来获取系统数据,例如前
⾯超哥交给⼤家的iotop,glances,htop,free,ps等查看服务器状态的命令。
运维⼈员通过系统管理的命令来获取服务器数据,为了分析问题,可能会把数据复制
到本地机器,通过excel等⼯具进⾏制表,画图分析服务器性能动态。
这种⼿动管理服务器的麻烦在于,服务器出现问题的时候,运维⽆法即使的发现,可
能服务器内存满了,⽹站应⽤挂了,⽤户过来投诉才能发现,那此时⽼板可能会训斥
运维同学⼀⼩时以上。。多么可怕。
有了监控软件之后
超哥作为⼀个运维,会使⽤监控系统查看服务器状态以及⽹站流量指标,利⽤监控系
统的数据去了解上线发布的结果,和⽹站的健康状态。
利⽤⼀个优秀的监控软件,我们可以:
通过⼀个友好的界⾯进⾏浏览整个⽹站所有的服务器状态
可以在web前端⽅便的查看监控数据
可以回溯寻找事故发⽣时系统的问题和报警情况
有了⼀套完善的监控体系,你就可以悠闲的喝着咖啡⼲活,⽽不⽤提⼼吊胆。
监控系统是整个运维⾃动化体系中⾮常重要的环节,从服务器上架到机房,到最后下
架回收,整个过程都应该有监控的存在。
服务器上架的硬件监控,检测线路,服务器接⼝状态
1.保障企业数据的安全可靠。
2.为客户提供7*24⼩时服务。
3.不断提升⽤户的体验。
在关键时刻,提前提醒我们服务器要出问题了。
当出问题之后,可以便于找到问题的根源。
1
2
3
4
5
6
7
8
9
服务器运⾏时的监控,系统指标监控,且在出现异常的时候发出报警通知对应的⼈员
在服务器回收的时候,要取消硬件,软件的监控
并且⼤型公司还会对监控系统进⾏开发,确保有API能够⽅便的和其他部⻔同事进⾏
协同⼯作。
互联⽹公司⾥的运维
⼀般公司⾥的运维,⼤致可以分为基础运维、应⽤运维、运维开发、监控组四⼤部
分。
基础运维,负责IDC运维,服务器上下架,⽹络设备等
应⽤运维,也就是system administrator,系统管理员
运维开发,负责运维⼯具的开发,系统开发等,例如开发监控系统,代码发布系统
监控组,也就是24⼩时值班的⼈员,需要时刻关注服务器,⽹站的状况,出现问题后,第⼀
时间联系相关运维以及研发⼈员。
运维的难处
国内的互联⽹⼤⼚,拥有⼏百,⼏千台服务器是很常⻅的,因此运维⼯程师的招聘需
求量很⼤,且⼯作量也很⼤,每天在⼏千台服务器上敲命令,查看系统状态,发布代
码,任务是⾮常繁琐的。
国内常⻅的运维新闻就是:
⼜是⼀年⼀度的双⼗⼀,今晚⼜是⼀个不眠之夜,对于程序员,运维,整个IT团队都要熬夜
了(但是他们的收益也是巨⼤的)
新浪某男星⼜被爆出丑闻,微博⼜瘫痪啦!
从这样的新闻就可以看出运维⼈员的难处,超哥也曾彻夜不眠的维护服务器,⼼塞
呀。
超哥也还遇⻅过⼀些难事:
服务器崩溃,⽹站后台500挂了,由于没有监控,⼤伙都还不知道,直到其他部⻔的同事打
来电话⼀顿凶
代码发布太过于繁琐,每⼀台机器都要⾃⼰⼿动执⾏部署,⼀台⼀台的检查
剩余16页未读,继续阅读
资源评论
confined.
- 粉丝: 133
- 资源: 3
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功