运维架构全览和平台自动化演变

preview
4星 · 超过85%的资源 需积分: 0 72 下载量 25 浏览量 更新于2018-03-25 1 收藏 14.34MB PDF 举报
运维架构全览和平台自动化演变的知识点涵盖面广泛,下面将针对标题和内容中提到的各个部分进行详细解读: 一、运维团队和职责说明 1. 应用运维:主要负责业务应用的日常运行、问题解决、性能优化和故障处理。 2. 系统运维:涵盖服务器和操作系统级别的监控、维护、升级、配置和问题处理。 3. 运维开发:通过编写脚本或开发工具,提高运维工作的自动化和效率。 4. 监控运维:负责搭建和维护监控系统,确保系统正常运行,及时发现和处理异常。 5. DBA团队:专注于数据库的性能优化、备份恢复、故障排查和安全加固。 6. 安全团队:负责企业的网络安全,进行安全策略的制定和实施,以及安全事故的应急响应。 二、运维体系架构 体系架构是运维工作的骨架,大众点评的运维体系架构涉及以下几个方面: 1. CDN加速和智能DNS:用于提升静态和动态资源的访问速度以及智能地解析用户请求。 2. 硬件和软件负载均衡:分别包括4层和7层的负载均衡技术,确保服务的稳定性和高可用。 3. 灾备策略:制定灾难备份计划,包括硬件防火墙、负载均衡器和服务器集群的备份。 4. 服务器集群:包括应用服务器、数据库服务器以及缓存服务器,分布在不同机房以提高业务连续性。 三、运维系统介绍 大众点评的运维系统较为全面,包括但不限于: 1. 全方位监控系统:对运维环境中的各项指标进行实时监控,包括服务器性能、网络流量、应用状态等。 2. 自动化平台系统:实现运维工作的自动化,减少重复劳动,提高工作效率。 3. 配置类和管理系统:对服务器环境配置、应用配置以及资产进行集中管理和维护。 4. 记录和运营分析系统:记录运维过程中的各种数据和事件,为运营分析提供支持。 四、运维演变过程 运维的发展演变可以从以下几个维度来了解: 1. 工具化:将常见运维任务转化为工具化的操作,以提高效率。 2. 自动化:通过编写脚本或使用自动化工具减少人工干预,减少人为错误。 3. 平台化:构建统一的运维管理平台,集中管理各种运维任务和服务。 4. 故障处理:建立全面的故障响应机制,快速定位和解决故障。 5. 线上服务管理:管理线上运行的服务,确保服务质量,满足业务需求。 五、运维系统的组成和功能 从提供的部分内容来看,运维系统包括但不限于以下几个模块: 1. Cat业务监控:对业务进行实时监控,及时发现问题。 2. 页面缓存与灾备:使用CDN和页面缓存技术提高访问速度,并实现数据的灾备。 3. Zabbix:一个基于Web的开源监控工具,用于监控服务器、网络设备和应用。 4. Puppet:一个自动化配置管理工具,用于管理服务器配置。 5. Logscan:日志扫描工具,用于监控和分析系统日志。 6. GO平台系统:可能指的是用于代码上线和任务调度的管理系统。 总结以上内容,大众点评的运维架构全览和平台自动化演变涉及运维团队的职能划分、运维体系架构、运维系统的构建与完善、以及运维工作从手动到自动化的转变。大众点评的运维工作不仅仅局限于传统的系统和网络维护,还包括了业务监控、自动化工具开发、故障处理等多个层面,形成了一套较为完整的IT运维体系。通过不断的优化和升级,大众点评的运维体系能够更好地支撑其业务发展,提高系统稳定性,优化用户体验。