sre

什么是 SRE(网站可靠性工程)?

网站可靠性工程师 ( Site Reliability Engineer ) 是近来越来越多看到的一个职位。它是什么意思?它来自哪里?让我们从 Google SRE 团队来学习。本…

2017 年的八大系统运维和工程发展趋势

预测趋势是棘手的,尤其是在快速发展的系统运维和工程领域。2016 年,在我们的 Velocity 大会上,我们讨论了分布式系统、SRE、容器化、无服务架构,人员倦怠以及与提供软件相…

什么是 SRE?它和 DevOps 是怎么关联的?

大型企业里 SRE 角色比较常见,不过小公司也需要 SRE。虽然 站点可靠性工程师 site reliability engineer (SRE)角色在近几年变得流行起来,但是很多…

系统管理员与网站可靠性工程师(SRE)对比:区别在那儿?

系统管理员和网站可靠性工程师(SRE,下同)对于任何组织来讲都很重要。本篇将介绍下两者的不同之处。在 IT 行业,成为多面手或是专家的争议一直存在。99% 的传统系统管理员都被归到…

探索 Kubernetes 生态系统(2021 版)

这份可下载的指南充满了有用的教程,让 SRE 和系统管理员使用 Kubernetes 获得便利。Kubernetes 是容器编排的事实标准,在基础设施管理和应用开发方面已经迅速发展…

得物SRE K8s 故障诊断:从 CPU 高负载到挂载泄露根源揭示

一、背景 现代软件部署中,容器技术已成为不可或缺的一环,在云计算和微服务架构中发挥着核心作用。随着容器化应用的普及,确保容器环境的可靠性成为了一个至关重要的任务。这就是容器SRE(…