在之前的很多zabbix的文章中并未提起zabbix Actions,Actions动作完成自愈,在我看来需要对zabbix做规划后使用较妥Actions可以在指定的条件下触发操作…
以yum安装为例,直接卸载后重新安装即可,如果存在proxy层,也需要更新停止服务[root@DS-VM-Node114 ~]# systemctl stop zabbix-ser…
由于一些原因,我需要在内网搭建elk平台,采取云机器的日志,并且云节点并不是一家的,这就意味着这些云机器内网不通,分布广泛在内网搭建elk环境,并且只想用拉取的模式,也就是说,我内…
在elasticsearch中有30天的试用期,我找到网上大神的一些文章,试用了之后发现可以进行破解使用,整个过程比较简单,特此写下笔记一,破解x-pack 6.3.2我也不清楚为…
在之前的一篇中提到使用redis作为转发思路在前面两篇中写的都是elk的安装,这篇叙述在6.3.2中的一些filebeat收集日志和处理的问题,以nginx为例,后面的可能会有,也…
grafana能够更好的提供分析展示的工作,而且他很强大,支持的类型也很多,如:graphite,elasticsearch,influxDB,cloudwatch,prometh…
prometheus诞生2012,许多公司采用,并且该项目目前非常活跃。具有由度量名称和键/值对标识的时间序列数据的多维数据模型。查询语言非常灵活,可以定义已有的各种信息组合不依赖…
cAdvisor(Container Advisor)为容器用户提供了对其运行容器的资源使用和性能特征的理解。它是一个运行守护程序,用于收集,聚合,处理和导出有关正在运行的容器的信…
node_exporter用Go编写的一个收集器,主要指标来在*NIX内核公开的硬件和操作系统指标。但是每个操作系统上都有不同的支持。如:linux系统的地址解析arp,bcach…
开始配置filebeat,在这之前,你或许需要了解下之前的配置结构[ELK6.3.2安装与配置[跨网络转发思路]](https://www.linuxea.com/1889.htm…
zabbix 配置 Zabbix-in-Telegram加入你在香港或者其他地方,需要使用Telegram完成zabbix监控告警功能,你可以参考本章。如果在国内,推荐使用丁丁,或…
此前做了Telegram的警报发送,发现误报较多,尝试使用slack的方式,发现简洁明了,颇为好用。代码来自github,可参阅本章。此前的Telegram和slack都没有做警报…
prometheus自动发现(scrape them)在官网中方式有很多,我这里介绍的是使用consul_sd_config配合registrator来做,registrator作…
我花了一点时间整理了一套zabbix的安装脚本,便于部署和安装。它包括了zabbix-server,zabbix-agent的安装,初始化配置,在4.0之后加入了docker-co…
Zabbix发布了4.2版本,带有一系列新功能。在Zabbix自己的网站上有一个很好的概述,但一定要检查文档中的“Zabbix 4.2中的新功能”部分,因为它更完整! 一个新功能是…
在实际使用中,通常我们会对一些端口进行监控,比如nginx,mariadb,php等。要完成一个端口监控是简单容易的。net.tcp.listen[80]如上,既可对tcp 80获…
我们遇到的场景是CPUThrottlingHigh 警报被正常触发,而触发的对象的CPU本身并不高,或者空闲。鉴于此,我们开始怀疑这个警报的必然性。通常在许多情况下,会将此警报修改…
通常在k8s中,pod是随时可以被替换的,在整个环境里往往我们不太关注某一条鱼,只关注整个鱼群的状态,因此监控数据不会存储太长,因为借鉴意义并不大。但是有时的确想要从 Promet…
promscale 是一个开源的可观察性后端,用于由 SQL 提供支持的指标和跟踪。它建立在 PostgreSQL 和 TimescaleDB 的强大和高性能基础之上。它通过 Op…
我们知道,在使用promentheus的过程中,默认的数据量一旦到一个量级后,查询区间的数据会非常缓慢,甚至一个查询就可能导致promentheus的崩溃,尽管我们不需要存储多久的…