openGauss5.1应用开发指南：示例：逻辑复制代码示例

数据运维 2023-10-24 醒在深海的猫手机阅读

下面示例演示如何通过JDBC接口使用逻辑复制功能的过程。

针对逻辑复制的配置选项，除了在逻辑解码中的配置选项外，还有专门给JDBC等流式解码工具增加的配置项，如下所示：

解码线程并行度
通过配置选项parallel-decode-num，指定并行解码的Decoder线程数量。其取值范围为1~20的int型，取1表示按照原有的串行逻辑进行解码，取其余值即为开启并行解码。默认值为1。当该选项配置为1时，禁止配置以下选项：解码格式选项decode-style、批量发送选项sending-batch和并行解码队列长度选项parallel-queue-size。
解码格式
通过配置选项decode-style，指定解码格式。其取值为char型的字符'j'、't'或'b'，分别代表json格式、text格式及二进制格式。默认值为'b'即二进制格式解码。该选项仅允许并行解码时设置，且二进制格式解码仅在并行解码场景下支持。与二进制格式对应的json和text格式，在批量发送的解码结果中，每条解码语句的前4字节组成的uint32代表该条语句总字节数（不包含该uint32类型占用的4字节，0代表本批次解码结束），8字节uint64代表相应lsn（begin对应first_lsn，commit对应end_lsn，其他场景对应该条语句的lsn）。

说明：
二进制格式编码规则如下所示：

前4字节代表接下来到语句级别分隔符字母P（不含）或者该批次结束符F（不含）的解码结果的总字节数，该值如果为0代表本批次解码结束。

接下来8字节uint64代表相应lsn（begin对应first_lsn，commit对应end_lsn，其他场景对应该条语句的lsn）。

接下来1字节的字母有5种B/C/I/U/D，分别代表begin/commit/insert/update/delete。

第3.接下来1字节的字母有5种B/C/I/U/D，…步字母为B时：

接下来的8字节uint64代表CSN。

接下来的8字节uint64代表first_lsn。

【该部分为可选项】接下来的1字节字母如果为T，则代表后面4字节uint32表示该事务commit时间戳长度，再后面等同于该长度的字符为时间戳字符串。

因为之后仍可能有解码语句，接下来会有1字节字母P或F作为语句间的分隔符，P代表本批次仍有解码的语句，F代表本批次完成。

第3.接下来1字节的字母有5种B/C/I/U/D，…步字母为C时：

【该部分为可选项】接下来1字节字母如果为X，则代表后面的8字节uint64表示xid。

【该部分为可选项】接下来的1字节字母如果为T，则代表后面4字节uint32表示时间戳长度，再后面等同于该长度的字符为时间戳字符串。

因为批量发送日志时，一个COMMIT日志解码之后可能仍有其他事务的解码结果，接下来的1字节字母如果为P则表示该批次仍需解码，如果为F则表示该批次解码结束。

第3.接下来1字节的字母有5种B/C/I/U/D，…步字母为I/U/D时：

接下来的2字节uint16代表schema名的长度。

按照上述长度读取schema名。

接下来的2字节uint16代表table名的长度。

按照上述长度读取table名。

【该部分为可选项】接下来1字符字母如果为N代表为新元组，如果为O代表为旧元组，这里先发送新元组。

接下来的2字节uint16代表该元组需要解码的列数，记为attrnum。

以下流程重复attrnum次。

接下来2字节uint16代表列名的长度。

按照上述长度读取列名。

接下来4字节uint32代表当前列类型的Oid。

接下来4字节uint32代表当前列的值（以字符串格式存储）的长度，如果为0xFFFFFFFF则表示NULL，如果为0则表示长度为0的字符串。

按照上述长度读取列值。

因为之后仍可能有解码语句，接下来的1字节字母如果为P则表示该批次仍需解码，如果为F则表示该批次解码结束。

限制仅备机解码
通过配置选项standby-connection，指定是否限制仅备机解码。其取值为bool型（可用0或1表示），取true（或1）代表限制仅允许连接备机解码，连接主机解码时会报错退出；取false（或0）时不做限制。默认值为false（0）。
批量发送
通过配置选项sending-batch，指定是否批量发送。其取值范围为0或1的int型，取0表示逐条发送解码结果，取1表示解码结果累积到达1MB则批量发送解码结果。默认值为0。该选项仅允许并行解码时设置。开启批量发送的场景中，当解码格式为'j'或't'时，在原来的每条解码语句之前会附加一个uint32类型，表示本条解码结果长度（长度不包含当前的uint32类型），以及一个uint64类型，表示当前解码结果对应的lsn。
并行解码队列长度
通过配置选项parallel-queue-size，指定并行逻辑解码线程间进行交互的队列长度。取值范围【2，1024】，且必须为2的幂数，默认值为128。队列长度和解码过程的内存使用量正相关。
逻辑解码内存阈值
通过配置选项max-txn-in-memory指定单个事务解码中间结果缓存的内存阈值；单位为MB，范围【0，100】，默认值为0，表示不管控内存使用。通过配置选项max-reorderbuffer-in-memory指定所有事务解码中间结果缓存的内存阈值；单位为GB，范围【0，100】，默认值为0，表示不管控内存使用。当超过内存阈值时，解码过程将出现解码中间结果写临时文件的现象，影响逻辑解码的性能。
逻辑解码发送超时阈值
通过配置选项sender-timeout指定内核与客户端的心跳超时阈值。当该时间段内没有收到客户端任何消息，逻辑解码将主动停止，并断开和客户端的连接。单位为毫秒（ms），范围【0, 2147483647】，默认值取决于GUC参数logical_sender_timeout配置。
JDBC默认设置逻辑解码连接的socketTimeout=10s，备机解码在主机压力大的时候可能会导致连接超时关闭，可以通过配置withStatusInterval(10000,TimeUnit.MILLISECONDS)，调整超时时间解决。

在并行解码的标准场景下（16核CPU、内存128G、网络带宽 > 200MBps、表的列数为10~100、单行数据量0.1KB~1KB、DML操作以insert为主、不涉及落盘事务即单个事务中语句数量小于4096、parallel-decode-num为8、解码格式为'b'且开启批量发送功能），解码性能（这里以xlog消耗量为标准）不低于100MBps。为保证解码性能达标以及尽量降低对业务的影响，一台备机上应尽量仅建立一个并行解码连接，保证CPU、内存、带宽资源充足。

注意：逻辑复制类PGReplicationStream为非线程安全类，并发调用可能导致数据异常。

//逻辑复制功能示例：文件名，LogicalReplicationDemo.java //前提条件：添加JDBC用户机器IP到数据库白名单里，在pg_hba.conf添加以下内容即可： //假设JDBC用户IP为10.10.10.10 //host all all 10.10.10.10/32 sha256 //host replication all 10.10.10.10/32 sha256

import org.postgresql.PGProperty; import org.postgresql.jdbc.PgConnection; import org.postgresql.replication.LogSequenceNumber; import org.postgresql.replication.PGReplicationStream;

import java.nio.ByteBuffer; import java.sql.DriverManager; import java.util.Properties; import java.util.concurrent.TimeUnit;

public class LogicalReplicationDemo { private static PgConnection conn = null; public static void main(String[] args) { String driver = "org.postgresql.Driver"; //此处配置数据库IP以及端口，这里的端口为haPort，通常默认是所连接DN的port+1端口 String sourceURL = "jdbc:postgresql://$ip:$port/postgres"; //默认逻辑复制槽的名称是：replication_slot //测试模式：创建逻辑复制槽 int TEST_MODE_CREATE_SLOT = 1; //测试模式：开启逻辑复制（前提条件是逻辑复制槽已经存在） int TEST_MODE_START_REPL = 2; //测试模式：删除逻辑复制槽 int TEST_MODE_DROP_SLOT = 3; //开启不同的测试模式 int testMode = TEST_MODE_START_REPL;

try { Class.forName(driver); } catch (Exception e) { e.printStackTrace(); return; }

try { Properties properties = new Properties(); PGProperty.USER.set(properties, "user"); PGProperty.PASSWORD.set(properties, "passwd"); //对于逻辑复制，以下三个属性是必须配置项 PGProperty.ASSUME_MIN_SERVER_VERSION.set(properties, "9.4"); PGProperty.REPLICATION.set(properties, "database"); PGProperty.PREFER_QUERY_MODE.set(properties, "simple"); conn = (PgConnection) DriverManager.getConnection(sourceURL, properties); System.out.println("connection success!");

if(testMode == TEST_MODE_CREATE_SLOT){ conn.getReplicationAPI() .createReplicationSlot() .logical() .withSlotName("replication_slot") //这里字符串如包含大写字母则会自动转化为小写字母 .withOutputPlugin("mppdb_decoding") .make(); }else if(testMode == TEST_MODE_START_REPL) { //开启此模式前需要创建复制槽 LogSequenceNumber waitLSN = LogSequenceNumber.valueOf("6F/E3C53568"); PGReplicationStream stream = conn .getReplicationAPI() .replicationStream() .logical() .withSlotName("replication_slot") .withSlotOption("include-xids", false) .withSlotOption("skip-empty-xacts", true) .withStartPosition(waitLSN) .withSlotOption("parallel-decode-num", 10) //解码线程并行度 .withSlotOption("white-table-list", "public.t1,public.t2") //白名单列表 .withSlotOption("standby-connection", true) //强制备机解码 .withSlotOption("decode-style", "t") //解码格式 .withSlotOption("sending-batch", 1) //批量发送解码结果 .withSlotOption("max-txn-in-memory", 100) //单个解码事务落盘内存阈值为100MB .withSlotOption("max-reorderbuffer-in-memory", 50) //正在处理的解码事务落盘内存阈值为50GB .start(); while (true) { ByteBuffer byteBuffer = stream.readPending();

if (byteBuffer == null) { TimeUnit.MILLISECONDS.sleep(10L); continue; }

int offset = byteBuffer.arrayOffset(); byte[] source = byteBuffer.array(); int length = source.length - offset; System.out.println(new String(source, offset, length));

//如果需要flush lsn，根据业务实际情况调用以下接口 //LogSequenceNumber lastRecv = stream.getLastReceiveLSN(); //stream.setFlushedLSN(lastRecv); //stream.forceUpdateStatus();

} }else if(testMode == TEST_MODE_DROP_SLOT){ conn.getReplicationAPI() .dropReplicationSlot("replication_slot"); } } catch (Exception e) { e.printStackTrace(); return; } } }