没有合适的资源?快使用搜索试试~ 我知道了~
深入解读SRE(站点可靠性工程)
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 28 浏览量
2023-10-17
20:54:15
上传
评论
收藏 2.02MB PPTX 举报
温馨提示
试读
26页
该文档非常深入的解读了SRE的方方面面,内容包含:SRE概述,SRE目标,SRE关键点,SRE核心原则,SRE与传统运维的差异等12个方面。让你可以可以深入的了解SRE。
资源推荐
资源详情
资源评论
深入解读SRE(Site Reliability Engineering)
02
SRE目标
03
SRE关键点
目录
CONTENT
01
SRE概述
05
SRE与传统运维的差异
04
SRE核心原则
07
如何从0到1自建SRE体系
08
自建SRE体系会面临哪些问题和挑战
06
SRE与DEVOPS的关系
10
SRE在组织中的位置和作用
09
SRE的角色,职责及所需技能
11
SRE常用的一些工具平台
12
SRE未来发展趋势
02
SRE目标
03
SRE关键点
目录
CONTENT
01
SRE概述
05
SRE与传统运维的差异
04
SRE核心原则
07
如何从0到1自建SRE体系
08
自建SRE体系会面临哪些问题和挑战
06
SRE与DEVOPS的关系
10
SRE在组织中的位置和作用
09
SRE的角色,职责及所需技能
11
SRE常用的一些工具平台
12
SRE未来发展趋势
SRE概述
SRE是Site Reliability Engineering(站点可靠性工程)的缩写。它是一种软件工程领域的实践方法,旨在通过将软件工程和
系统管理的概念相结合,提高大规模分布式系统的可靠性、可伸缩性、效率和可维护性。
SRE团队接受错误是软件部署过程的一部分。他们不是追求完美的解决方案,而是通过服务级别协议(SLAs),服务级别指标
(SLIs)和服务级别目标(SLOs)来监控软件性能。他们在生产环境部署应用程序后,观察并监控性能指标 。
SRE鼓励频繁但小的变更来维护系统的可靠性。SRE自动化工具使用一致但可重复的过程来执行以下操作:SRE使用政策和流程
,将可靠性原则嵌入到交付管道的每一步。一些自动解决问题的策略包括以下内容:基于服务级别目标开发质量门来更早地检
测问题,做出确保系统弹性的架构决策。
SRE涉及到网站可靠性工程师在软件团队中的参与。SRE团队设定SRE的关键指标,并根据系统的风险承受水平确定错误预算。
如果错误数量较低,开发团队可以发布新功能。然而,如果错误超过了允许的错误预算,团队会暂停新的变更并解决现有的问
题。
02
SRE目标
03
SRE关键点
目录
CONTENT
01
SRE概述
05
SRE与传统运维的差异
04
SRE核心原则
07
如何从0到1自建SRE体系
08
自建SRE体系会面临哪些问题和挑战
06
SRE与DEVOPS的关系
10
SRE在组织中的位置和作用
09
SRE的角色,职责及所需技能
11
SRE常用的一些工具平台
12
SRE未来发展趋势
剩余25页未读,继续阅读
资源评论
LarryHai6
- 粉丝: 791
- 资源: 65
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 论文(最终)_20240430235101.pdf
- 基于python编写的Keras深度学习框架开发,利用卷积神经网络CNN,快速识别图片并进行分类
- 最全空间计量实证方法(空间杜宾模型和检验以及结果解释文档).txt
- 5uonly.apk
- 蓝桥杯Python组的历年真题
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 2023-04-06-项目笔记 - 第一百十九阶段 - 4.4.2.117全局变量的作用域-117 -2024.04.30
- 前端开发技术实验报告:内含4四实验&实验报告
- Highlight Plus v20.0.1
- 林周瑜-论文.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功