openGauss6.0数据库绑定变量的PBE性能抖动测试

PBE:Parse Bind Execute

    • 现象
    • 概念
    • PREPARE语句
    • 案例模拟
    • 总结

看腻了就来听听视频讲解吧:https://www.bilibili.com/video/BV1aE42157Sg/
PostgreSQL数据库绑定变量的PBE性能抖动问题:
https://www.modb.pro/db/1772166024404766720

现象

应用JDBC接口调用SQL执行慢(几十分钟),客户端Dbeaver或gsql执行快(秒内)

概念

SQL语句结构完全相同,但入参不同,这种情况下考虑在生成执行计划时,将SQL中不同的数值以参数的形式作为替代($)。此后的每次查询都可以根据语句中的数值将执行计划中的参数替换后再做执行,以此来提高此类SQL的执行效率。

实现方式是使用 java 的 preparedStatement 预编译接口,在数据库内核中对应的名称即为PBE(Parse Bind Execute)。

在执行一个SQL时,首先生成执行计划(进行语义分析、词法解析、逻辑优化、物理优化)、执行、结果传输等操作。如果一个SQL在应用中反复使用,可以将此SQL执行计划固化下来,只做一次prepare,后面执行时就不需要进行前面执行计划的生成操作,直接使用prepare好的执行计划。

PREPARE语句


特点:

  1. 会话级别,session结束PREPARE语句也不存在了。下次再使用需重新创建
  2. PREPARE语句不能在多个并发的client中共有
  3. PREPARE语句可以通过DEALLOCATE命令清除。
  4. 会话中所有可用的PREPARE语句获取可查询系统视图:pg_prepared_statements

openGauss同PostgreSQL一样,默认前5次执行时每次都会根据实际传入的实际绑定变量生成执行计划(custom plan),即每次都是硬解析;当第6次开始执行时,会生成一个通用的执行计划(generic plan),同时与前5次的执行计划进行比较,如果比较的结果是通用执行计划不比前5次的执行计划差,以后就会把这个通用的执行计划固定下来,这之后即使传入的值发生变化后,执行计划也不再变化。这就相当于Oracle打开了绑定变量窥视的功能。

PostgreSQL 的PBE相关参数介绍:

PG 12 中新增plan_cache_mode参数,用来改变执行计划的缓存模式。

plan_cache_mode参数介绍:

其中default值就是auto,即自动修正执行计划。
force_custom_plan:为每个指定的参数重新创建新的执行计划。
force_generic_plan:不依赖与参数的值,执行计划可以在各个语句间重复使用。

openGauss 的PBE相关参数介绍:

  • enable_pbe_optimization

  • plan_cache_mode

案例模拟

创建存在严重数据倾斜的数据场景,即为“openGauss”的数据有100万,而为“PostgreSQL”的数据是2条

-- 创建测试表和数据 drop table IF EXISTS t_pbe; create table t_pbe(col1 serial, col2 text); insert into t_pbe(col2) select 'openGauss' from generate_series(1, 1000000); insert into t_pbe(col2) select 'PostgreSQL' from generate_series(1, 2); CREATE INDEX idx_t_pbe_col2 ON t_pbe(col2); vacuum analyze t_pbe;