使用 Thanos 集中管理多 Prometheus 实例数据 云计算 2023-01-04 共饮一杯 手机阅读 1. 监控的分层 如上图,在建设监控系统时,会采用两种策略:分层监控。IaaS、MySQL 中间件、App 层监控分开的好处是,系统之间具有高可用性、容错性。当 App 层监控无法工作时,IaaS 层监控立马就会体现出来。 长短期指标分离。短期指标用来提供给告警系统高频查询近期数据,长期指标用来提供给人查询时间跨度更大的数据集。 Prometheus 载入的不是降采样数据 Sidecar, 用于连接 Prometheus,提供 Query 查询接口、也可以上报数据 Store Gateway, 访问放在对象存储的指标数据 Compact, 压缩采样、清理对象存储中的数据 Receive, 接收 Prometheus Remote Write 的数据 Ruler, 配置和管理告警规则 Prometheus 无状态 只需要暴露 Receiver 给 Prometheus 访问 上传 Prometheus 的短期指标数据。默认每两个小时,创建一个块,上传到对象存储。 需要 Store Gateway 能访问每个 Prometheus 实例 https://artifacthub.io/packages/helm/bitnami/thanos https://github.com/shaowenchen/demo https://imroc.cc/post/202004/build-cloud-native-large-scale-distributed-monitoring-system-3/
华为云云原生FinOps解决方案,释放云原生最大价值 华为云云原生FinOps通过可视化的成本洞察和成本优化,帮助用户精细用云以提升单位成本的资源利用率,实现降本增效目标 企业上云现状:上云趋势持续加深,但云上开支存在显著浪费 根据Flexer 2024年最新的一项调查显示,当前有超过70%的企业重度使用云服务,而这个数据去年是65%。由此可见,越来越多的企业开始把业务部署在云上。企业在使用云厂商提供的云服务的同时,也在为云服务的花费买单。调查显示, 云计算 2024-05-04 共饮一杯
KRS:一个收集 Kubernetes 资源统计数据的新工具 零配置工具简化了信息收集,例如在某个命名空间中运行了多少个 pod。 最近我在纽约的 O'Reilly Velocity 就 Kubernetes 应用故障排除的主题发表了演讲,并且在积极的反馈和讨论的推动下,我决定重新审视这个领域的工具。结果,除了 kubernetes-incubator/spartakus 和 kubernetes/kube-state-metrics 之外,我们还没有太多的 云计算 2023-07-30 共饮一杯
存储性能加速引擎之预读 顺序预读(prefetch,在Linux中也称为预读,read ahead)是一种用于提升顺序读性能的技术,用于缩小存储设备和应用程序之间巨大的效率差距。Linux内核在通用预读框架中执行顺序文件预读,它主动拦截VFS层中的文件读取请求,并将顺序的请求转换为异步预读请求,为即将到来的请求引入数据块,并在大块中进行。 I/O预读背景 带宽和延迟是I/O性能的两个主要衡量标准。对于这两个标准,在磁盘、 云计算 2023-07-09 共饮一杯
享道出行:容器弹性技术驱动下的智慧出行稳定性实践 作者:郑嘉扬、何杉 前言 享道出行是一家专注于出行服务的专业品牌,是上汽集团实现汽车产业“新四化”(即“电动化、智能网联化、共享化、国际化”)的重要组成部分。作为上汽集团移动出行战略品牌,享道出行充分利用全产业链竞争优势,从消费者对安全及品质的需求出发,通过为消费者提供安全、高效、舒适、便捷的品质体验,打造品质出行服务平台。 在快速的业务发展过程中,基础设施规模的不断增长,为企业管理者带来了对于效 云计算 2024-04-01 共饮一杯