什么是 JMX?(Trino JMX 实战讲解)

2023年 9月 5日 24.3k 0

一、概述

JMX 是 Java Management Extensions(Java管理扩展) 的缩写,它是 Java 平台上用于管理和监控应用程序、系统和网络资源的一种标准化的管理和监控框架。JMX 提供了一种标准的方式,通过这种方式,开发人员可以暴露应用程序中的各种管理和监控信息,然后可以使用 JMX 客户端工具或应用程序来访问和操作这些信息。

JMX 允许开发人员定义称为 MBeans(Managed Beans)的管理组件,这些组件充当被管理资源的代理,并通过 JMX 接口公开资源的操作和属性。通过 MBeans,您可以监控和管理各种 Java 应用程序和服务器的性能、状态和配置。

JMX 主要用于以下一些方面:

  • 监控:可以使用 JMX 来监视应用程序的性能指标,例如内存使用、线程数、请求处理速度等。这对于实时性能分析和故障排除非常有帮助。
  • 管理:JMX 允许您在运行时管理应用程序,例如修改配置参数、重新加载资源、触发操作等。这有助于实现动态管理和配置。
  • 远程管理:JMX 支持远程访问,这意味着您可以在不必物理接触应用程序的情况下,从远程位置监控和管理应用程序。
  • 自定义监控:您可以编写自定义 MBeans 来公开特定于您的应用程序的监控数据和操作,以满足特定的管理需求。

总之,JMX 提供了一个强大的框架,用于管理和监控 Java 应用程序,这对于确保应用程序的稳定性和性能至关重要。它广泛用于企业级应用程序和服务器,如应用程序服务器、数据库服务器和中间件。

二、JMX 原理

图片图片

从图中我们可以看到,JMX的结构一共分为三层:

  • 基础层:主要是 MBean,被管理的资源。
  • MBean 分为如下四种,我接下来主要介绍 standard MBean

    类型

    描述

    standard MBean

    这种类型的MBean最简单,它能管理的资源(包括属性,方法,时间)必须定义在接口中,然后MBean必须实现这个接口。它的命名也必须遵循一定的规范,例如我们的MBean为Hello,则接口必须为HelloMBean。

    dynamic MBean

    必须实现javax.management.DynamicMBean接口,所有的属性,方法都在运行时定义

    open MBean

    此MBean的规范还不完善,正在改进中

    model MBean

    与标准和动态MBean相比,你可以不用写MBean类,只需使用javax.management.modelmbean.RequiredModelMBean即可。RequiredModelMBean实现了ModelMBean接口,而ModelMBean扩展了DynamicMBean接口,因此与DynamicMBean相似,Model MBean的管理资源也是在运行时定义的。与DynamicMBean不同的是,DynamicMBean管理的资源一般定义在DynamicMBean中(运行时才决定管理那些资源),而model MBean管理的资源并不在MBean中,而是在外部(通常是一个类),只有在运行时,才通过set方法将其加入到model MBean中。后面的例子会有详细介绍

  • 适配层:MBeanServer,主要是提供对资源的注册和管理。
  • 接入层:提供远程访问的入口。
  • 三、实战操作(开启 Trino JMX)

    1)环境部署

    Trino官方文档:https://trino.io/docs/current/

    这里为了快速部署就选择docke-compose部署了。

    git clone https://gitee.com/hadoop-bigdata/docker-compose-presto.git
    cd docker-compose-presto
    
    # 启动服务
    docker-compose -f docker-compose.yaml up -d
    
    # 查看
    docker-compose -f docker-compose.yaml ps

    2)开启 Trino JMX

    官方文档:https://trino.io/docs/current/admin/jmx.html

    1、配置 config.properties

    jmx.rmiregistry.port=9080
    jmx.rmiserver.port=9081

    参数解释:

    • jmx.rmiregistry.port:指定jmx RMI注册表的端口。JMX客户端应该连接到此端口。
    • jmx.rmiserver.port:指定jmx RMI服务器的端口。Trino导出许多指标,这些指标对于通过JMX进行监控非常有用。

    2、配置 jvm.config

    -Dcom.sun.management.jmxremote.rmi.port=9081

    jmx.rmiregistry.port、jmx.rmiserver.port 和 -Dcom.sun.management.jmxremote.rmi.port 这三者都涉及到 Java Management Extensions (JMX)和远程管理的端口配置,但它们各自在不同的上下文中起作用:

    • jmx.rmiregistry.port:这个属性指定了 RMI(Remote Method Invocation:远程方法调用) 注册表(RMI Registry)的端口号。RMI 注册表用于注册 JMX 服务,以便客户端可以查找并连接到 JMX 服务。通常情况下,RMI 注册表使用默认端口号 1099。通过设置 jmx.rmiregistry.port 属性,你可以指定 RMI 注册表使用的不同端口号,以防止端口冲突或增加安全性。
    • jmx.rmiserver.port:这个属性指定了 JMX 服务本身的 RMI 通信端口号。JMX 服务使用 RMI 进行远程通信,客户端通过这个端口与 JMX 服务通信。通常情况下,JMX 服务也使用默认的端口号 1099。通过设置 jmx.rmiserver.port 属性,你可以指定 JMX 服务的 RMI 端口号。
    • -Dcom.sun.management.jmxremote.rmi.port:这是 Java 系统属性,用于配置 JMX 远程连接的 RMI 端口号。它指定了客户端将用来连接到 JMX 服务的 RMI 端口号。通常情况下,如果不显式设置,它会使用与 jmx.rmiserver.port 相同的端口号。但你也可以使用这个系统属性来指定不同的端口号,以确保客户端可以连接到正确的端口。

    这三者之间的关系是:

    jmx.rmiregistry.port 和 jmx.rmiserver.port 分别指定 RMI 注册表和 JMX 服务的端口号。-Dcom.sun.management.jmxremote.rmi.port 可以用来指定客户端连接到 JMX 服务时所使用的 RMI 端口号,它通常设置为与 jmx.rmiserver.port 相同的端口号,但你也可以根据需要将其设置为不同的端口号。

    3、重新启动服务

    docker-compose -f docker-compose.yaml up -d
    docker-compose -f docker-compose.yaml ps

    4、获取监控数据

    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean

    图片图片

    通过jmx 接口就可以获取监控数据了/v1/jmx/mbean,但是数据很多,其实我们可以拿一些我们需要的指标数据即可。接下来我们通过jq 拿到各项监控的子接口。jq 命令的使用可以参考我这篇文章:Linux jq 命令讲解与实战操作(json字符串解析工具)

    # coodinator
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean|jq '.[].objectName'

    图片图片

    访问具体接口指标

    # 内存指标接口
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean|jq '.[].objectName'|grep -i memory
    
    # 指标名称
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean/java.lang:type=Memory|jq '.attributes[].name'
    
    # 指标值
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean/java.lang:type=Memory|jq '.attributes[].value'
    
    # 指标名称
    curl -s -H "X-Trino-User:admin"  http://192.168.182.110:30080/v1/jmx/mbean/trino.memory:type=MemoryPool,name=general|jq '.attributes[].name'
    # 指标值
    curl -s -H "X-Trino-User:admin"  http://192.168.182.110:30080/v1/jmx/mbean/trino.memory:type=MemoryPool,name=general|jq '.attributes[].value'

    图片图片

    # worker 节点,coodinator与worker节点的指标会有些不一样
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:49153/v1/jmx/mbean|jq '.[].objectName'
    
    # 获取内存接口
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:49153/v1/jmx/mbean|jq '.[].objectName'|grep -i memory
    
    # 指标名称
    curl -s -H "X-Trino-User:admin"  http://192.168.182.110:30080/v1/jmx/mbean/trino.memory:type=MemoryPool,name=general|jq '.attributes[].name'
    # 指标值
    curl -s -H "X-Trino-User:admin"  http://192.168.182.110:30080/v1/jmx/mbean/trino.memory:type=MemoryPool,name=general|jq '.attributes[].value'

    图片图片

    3)通过 jconsole 连接 JMX

    JConsole 是一个基于JMX的GUI工具,用于连接正在运行的JVM,不过此JVM需要使用可管理的模式启动。如果要把一个应用以可管理的形式启动,可以在启动是设置 com.sun.management.jmxremote。

    找到java安装bin目录,目录下有个jconsole可执行文件,双击点击打开。

    图片图片

    也可以通过 VisualVM 连接 JMX 查看数据

    图片图片

    4)常用的 Trino 指标接口和指标

    查询所有jmx子接口:

    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean|jq '.[].objectName'
    
    # 查询指标名称和值,示例如下:
    # 指标名称
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean/java.lang:type=Memory|jq '.attributes[].name'
    # 指标值
    curl -s -H "X-Trino-User:admin" http://192.168.182.110:30080/v1/jmx/mbean/java.lang:type=Memory|jq '.attributes[].value'

    以下就是常用的指标接口和指标说明:

    指标接口

    指标

    说明

    指标范围

    java.lang:type=Memory

    HeapMemoryUsage

    JVM内存使用量。

    Worker 和 Coodinator

    java.lang:type=Memory

    NonHeapMemoryUsage

    非堆内存使用量。

    worker 和 Coodinator

    trino.execution:name=QueryManager

    QueuedQueries

    排队数

    Coodinator

    trino.execution:name=QueryManager

    RunningQueries

    正在运行的查询总数

    Coodinator

    trino.execution:name=QueryManager

    ExternalFailures.OneMinute.Count

    每分钟外部异常导致的失败查询数。

    Coodinator

    trino.execution:name=QueryManager

    SubmittedQueries.OneMinute.Count

    每分钟提交的查询总数。

    Coodinator

    trino.execution:name=QueryManager

    CanceledQueries.OneMinute.Count

    已取消查询的数。

    Coodinator

    trino.execution:name=QueryManager

    InsufficientResourcesFailures.OneMinute.Count

    每分钟资源不足导致的失败查询数。

    Coodinator

    trino.execution:name=QueryManager

    UserErrorFailures.OneMinute.Count

    每分钟异常导致的失败查询数。

    Coodinator

    trino.execution:name=QueryManager

    CompletedQueries.OneMinute.Count

    已完成查询的总数。

    Coodinator

    trino.execution:name=SqlTaskManager

    FailedTasks.OneMinute.Count

    每分钟失败的Task数目。

    Coodinator

    trino.execution:name=SqlTaskManager

    InputDataSize.OneMinute.Count

    每分钟Task输入数据量。

    Coodinator

    trino.execution:name=SqlTaskManager

    InputPositions.OneMinute.Count

    每分钟Task输入数据行数。

    Coodinator

    trino.execution:name=SqlTaskManager

    OutputDataSize.OneMinute.Count

    每分钟Task输出数据量。

    Coodinator

    trino.execution:name=SqlTaskManager

    OutputPositions.OneMinute.Count

    每分钟Task输出数据行数。

    Coodinator

    trino.memory:type=MemoryPool,name=general

    FreeBytes

    节点内存池可用内存。

    worker 和 Coodinator

    trino.memory:type=MemoryPool,name=general

    MaxBytes

    节点内存池最大内存(JVM*70%)。

    worker 和 Coodinator

    trino.memory:type=MemoryPool,name=general

    ReservedBytes

    节点内存池reserved内存。

    worker 和 Coodinator

    trino.memory:type=MemoryPool,name=general

    ReservedRevocableBytes

    节点内存池revocable reserved内存。

    worker 和 Coodinator

    trino.memory:type=ClusterMemoryPool,name=general

    ReservedRevocableDistributedBytes

    集群内存池revocable reserved内存。

    Coodinator

    trino.memory:name=ClusterMemoryManager

    QueriesKilledDueToOutOfMemory

    oom killed的查询总数。

    Coodinator

    trino.memory:type=ClusterMemoryPool,name=general

    TotalDistributedBytes

    集群内存池总内存。

    Coodinator

    trino.memory:type=ClusterMemoryPool,name=general

    ReservedDistributedBytes

    集群内存池reserved内存。

    Coodinator

    trino.memory:name=ClusterMemoryManager

    ClusterUserMemoryReservation

    集群reserved user memory。

    Coodinator

    trino.memory:name=ClusterMemoryManager

    ClusterTotalMemoryReservation

    集群reserved内存。

    Coodinator

    trino.memory:name=ClusterMemoryManager

    NumberOfLeakedQueries

    集群内存泄漏的查询总数。

    Coodinator

    trino.memory:name=ClusterMemoryManager

    ClusterMemoryBytes

    集群总内存。

    Coodinator

    trino.execution.executor:name=TaskExecutor

    WaitingSplits

    任务执行器上等待的splits数。

    Coodinator

    trino.execution.executor:name=TaskExecutor

    RunningSplits

    任务执行器运行的splits数。

    Coodinator

    trino.execution.executor:name=TaskExecutor

    RunningSplits

    任务执行器总splits数。

    Coodinator

    上面只是开启了 Trino JMX,指标数据也采集了,怎么展示呢?下一篇文章重点讲解通过 JMX-Exporter 采集数据,然后通过 Prometheus 拉取JMX采集的数据,最后通过Grafana展示。

    相关文章

    JavaScript2024新功能:Object.groupBy、正则表达式v标志
    PHP trim 函数对多字节字符的使用和限制
    新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
    使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
    为React 19做准备:WordPress 6.6用户指南
    如何删除WordPress中的所有评论

    发布评论