什么是 SRE(网站可靠性工程)? 网站可靠性工程师 ( Site Reliability Engineer ) 是近来越来越多看到的一个职位。它是什么意思?它来自哪里?让我们从 Google SRE 团队来学习。 本文为 Niall Richard Murphy、Jennifer Petoff、Chris Jones、Betsy Beyer 编辑的 《网站可靠性工程》 Site Reliability Engineering 一书 linux中国 2024-07-19 大树
2017 年的八大系统运维和工程发展趋势 预测趋势是棘手的,尤其是在快速发展的系统运维和工程领域。2016 年,在我们的 Velocity 大会上,我们讨论了分布式系统、SRE、容器化、无服务架构,人员倦怠以及与提供软件相关的人力与技术挑战等诸多问题。以下是我们认为的下一年的趋势: 1、 分布式系统 我们认为这个很重要,我们在整个 Velocity 会议上再次关注了它。 2、 站点可靠性工程(SRE) 站点可靠性工程 ( Site Rel linux中国 2024-07-19 LOVEHL^ˇ^
什么是 SRE?它和 DevOps 是怎么关联的? 大型企业里 SRE 角色比较常见,不过小公司也需要 SRE。 虽然 站点可靠性工程师 site reliability engineer (SRE)角色在近几年变得流行起来,但是很多人 —— 甚至是软件行业里的 —— 还不知道 SRE 是什么或者 SRE 都干些什么。为了搞清楚这些问题,这篇文章解释了 SRE 的含义,还有 SRE 怎样关联 DevOps,以及在工程师团队规模不大的组织里 SRE linux中国 2024-07-18 向阳逐梦
系统管理员与网站可靠性工程师(SRE)对比:区别在那儿? 系统管理员和网站可靠性工程师(SRE,下同)对于任何组织来讲都很重要。本篇将介绍下两者的不同之处。 在 IT 行业,成为多面手或是专家的争议一直存在。99% 的传统系统管理员都被归到了多面手这类。 网站可靠性工程师 site reliability engineer (SRE)的角色则更加专精,并且在如 Google 般有着一定规模的头部公司中对其的需求不断增加。但总的来说这两者对于跑着应用的基础 linux中国 2024-07-18 贤蛋大眼萌
探索 Kubernetes 生态系统(2021 版) 这份可下载的指南充满了有用的教程,让 SRE 和系统管理员使用 Kubernetes 获得便利。 Kubernetes 是容器编排的事实标准,在基础设施管理和应用开发方面已经迅速发展成为容器环境的主导。作为一个拥有庞大的爱好者和专业人士社区的开源平台,以及作为云原生计算基金会的一部分,Kubernetes 不仅成为一个强大而令人印象深刻的编排系统本身,而且它还促进了一个庞大的相关工具和服务的生态系 linux中国 2024-07-17 泡泡
得物SRE K8s 故障诊断:从 CPU 高负载到挂载泄露根源揭示 一、背景 现代软件部署中,容器技术已成为不可或缺的一环,在云计算和微服务架构中发挥着核心作用。随着容器化应用的普及,确保容器环境的可靠性成为了一个至关重要的任务。这就是容器SRE(Site Reliability Engineering,站点可靠性工程)的职责所在。容器SRE工程师不仅要保证系统的高可用性,还需要优化运行效率,确保系统在各种压力和突发情况下的韧性。 然而,容器SRE的工作常常是背后 运维资讯 2024-06-14 泡泡