麻了,这让人绝望的大事务提交

2024年 1月 10日 99.3k 0

背景

继上次的if else优化也有段时间了,最近小猫又又又着道了,接手的那个项目又遇到了坑爹的地方,经常性的报死锁异常,经常性的主从延迟......通过报错信息按图索骥,发现代码是这样的。


这是一段商品发布的逻辑,我们可以看到参数校验、查询、最终的insert以及update全部揉在一个事务中。遇到批量发布商品的时候就经常出现问题了,数据库主从延迟是肯定少不了的。

开启优化

其实像上述小猫遇到的这种状况我们就称其为大事务,那么我们就大概有这么一个定义。我们将执行时间长,并且操作数据比较多的事务叫做大事务。

大事务产生的原因

在我们日常开发过程中,其实经常会遇到大事务,老猫总结了一下,往往原因其实总结下来有这么几点(当然存在纰漏的地方,也欢迎大家评论区留言补充)

  • 一次性操作的数据量确实多,大量的锁竞争,比如批量操作这种行为。
  • 事务粒度过大,代码中的 @Transactional使用不当,其他非DB操作比较多,耗时久。比如调用RPC接口,在例如上述小猫遇到的check逻辑甚至都揉在一起等等。
  • 造成的影响

    那么大事务造成的影响又是什么呢?

  • 从开发者的角度来看的话,部分大事务必定对应的复杂的业务逻辑,代码封装事务拆解不合理,研发侧维护困难,维护成本高。
  • 从最终系统以及运维角度来看
    • 出现了死锁。
    • 造成了主从延迟。
    • 大事务消耗更多的磁盘空间,回滚成本高。
    • 大事务发生的过程中,由于连接池持续被打开,很容易造成数据库连接池被沾满。
    • 接口响应慢导致接口超时,甚至导致服务不可用等等
      (欢迎大家补充)
  • 优化方案

    大事务既然有这么多坑,那么我们来看一下我们日常开发过程中,应该如何做到尽量规避呢?老猫整理了以下几种优化方法。

  • 降低事务颗粒度,大事务拆解小事务
    • 编程式事务代替@Transactional。
    • 非update以及insert动作外移。
  • 大数据量一次性提交尽可能拆解分批处理。
  • 拆解原始事务,异步化处理。
  • 降低事务颗粒度

    1、我们对@Transactional的事务粒度把控不好,有时候如果使用不当的话事务功能可能会失效,如果经验不足,很难排查,那么我们不如直接使用粗细粒度更好把控的编程式事务。TransactionTemplate。这样的话咱们的优化代码就可以写好才能如下方式。

    @Autowired
    private TransactionTemplate transactionTemplate;
    
    public boolean publishProduct(PublishProductRequest request) {
            externalSellerAuthorizeService.checkAuthorizeValid(request.getSellerId(),request.getThirdCategoryId(),request.getBrandId());
            ......
            transactionTemplate.execute((status) -> {
                try{
                    //执行insert
                    productDao.insert(productDO);
                    productDescDao.insert(productDescDO);
                    ....
                    //其他insert以及update操作
                }catch (Exception e) {
                    //回滚
                    status.setRollbackOnly();
                    return true;
                }
                return false;
            });
            return true;
        }
    
    非update以及insert动作外移。

    原始代码:

    @Transactional(rollbackFor=Exception.class)
       public void save(Req req) {
             checkParam(req);
             saveData1(req);
             updateData2(req);
       }
    
       private void checkParam(Req req){
           Data1 data = selectData1();
           Data2 data2 = selectData2();
           if(data.getSomeThing() != STATUS_YES){
              throw new BusinessTimeException(.....);
           }
       }
    

    然后部分小伙伴就觉得外移么,如果不用@Transactional的情况,那直接这样不就行了么。

    错误改造案例:

    class ServiceAImpl implements ServiceA {
      @Transactional(rollbackFor=Exception.class)
       public void save(Req req) {
             saveData1(req);
             updateData2(req);
       }
    
       private void checkParam(Req req){
           Data1 data = selectData1();
           Data2 data2 = selectData2();
           if(data.getSomeThing() != STATUS_YES){
              throw new BusinessTimeException(.....);
           }
       }
    
     public void save(Req req){
        checkParam(req);
        doSave(req);
     }
    }
    

    这个例子是非常经典的错误,这种直接方法调用的做法事务不会生效,老猫以前也踩过这样的坑。因为 @Transactional 注解的声明式事务是通过 spring aop 起作用的,
    而 spring aop 需要生成代理对象,直接方法调用使用的还是原始对象,所以事务不会生效。那么我们应该如何改造呢?我们看下正确的改造。

    正确改造方案1,当然还是利用上面的TransactionTemplate:

      @Autowired
      private TransactionTemplate transactionTemplate;
    
       public void save(Req req) {
             checkParam(req);
             transactionTemplate.execute((status) -> {
                try{
                    saveData1(req);
                    updateData2(req);
                    ....
                    //其他insert以及update操作
                }catch (Exception e) {
                    //回滚
                    status.setRollbackOnly();
                    return true;
                }
                return false;
            });
       }
    
       private void checkParam(Req req){
           Data1 data = selectData1();
           Data2 data2 = selectData2();
           if(data.getSomeThing() != STATUS_YES){
              throw new BusinessTimeException(.....);
           }
       }
    

    正确改造方案2,把 @Transactional 注解加到新Service方法上,把需要事务执行的代码移到新方法中。

      @Servcie
      public class ServiceA {
         @Autowired
         private ServiceB serviceB;
    
         private void checkParam(Req req){
           Data1 data = selectData1();
           Data2 data2 = selectData2();
           if(data.getSomeThing() != STATUS_YES){
              throw new BusinessTimeException(.....);
           }
       }
    
        public void save(Req req) {
              checkParam(req);
              serviceB.save(req);
        }
      }
    
       @Servcie
       public class ServiceB {
          @Transactional(rollbackFor=Exception.class)
          public void save(Req req) {
             saveData1(req);
             updateData2(req);
          }
       }
    

    正确改造方案3:将ServiceA 再次注入到自身(老猫觉得这种方式不优雅,不太推荐,这里就不写了)

    大数据量一次性提交尽可能拆解分批处理。

    我们再来看大数量批量请求的场景,咱们具体来分析一下,假设上游系统存在一个批量导入2w的数据操作。如果我们读取到上游导入的数据,并且直接执行DB一次性执行肯定是不合适的。这种情况就需要我们对其请求的数据量做一个拆解。我们可以采用Lists.partition等等方式将数据拆成多个小的批量然后再进行入库操作处理。

    @Servcie
    public class ServiceA {
      @Autowired
      private ServiceB serviceB;
    
      private void batchAdd(List<Long> inventorySkuIdList){
          List<List<Long>> partition = Lists.partition(inventorySkuIdList, 1000);
            for (List<Long> idList : partition) {
                List<InventorySkuDO> inventorySkuDOList = inventorySkuDao.selectByIdList(idList, null);
                if (CollectionUtils.isNotEmpty(inventorySkuDOList)) {
                   serviceB.doInsertUpdate(inventorySkuDOList);
                }
            }
      }
    }
    
    @Servcie
    public class ServiceB {
      @Transactional(rollbackFor=Exception.class)
      private void doInsertUpdate(List<InventorySkuDO> inventorySkuDOList){
            for (InventorySkuDO inventorySkuDO : inventorySkuDOList) {
               doInsert(inventorySkuDO);
               doUpdate(inventorySkuDO)
            }
      }
    }
    
    拆解原始事务,异步化处理。

    这种异步化处理的方案其实有两种方式进行异步化操作。尤其是涉及到第三方RPC调用或者HTTP调用的时候,这种方案就更加适合。

    方案一,采用CompletableFuture异步编排特性,当业务流程比较长的时候,我们可以将一个大业务拆解成多个小的任务进行异步化执行。比如咱们有个批量支付的业务逻辑,因为整个流程是同步的,所以大概有了下面这样的流程。(关于CompletableFeature老猫觉得挺有意思的,后续老猫会出专门的文章来理透该特性,欢迎大家持续关注)。

    completeFeature转存失败,建议直接上传图片文件

    对应转换成代码逻辑的话,大概是这样的:

    void doBatchPay() {
            CompletableFuture<Object> task1 = CompletableFuture.supplyAsync(() -> {
                return "订单信息";
            });
            CompletableFuture<Object> task2 = CompletableFuture.supplyAsync(() -> {
                try {
                   return doPay();
                } catch (InterruptedException e) {
                    //log add
                }
            });
    
            //task1、task2 执行完执行task3 ,需要感知task1和task2的执行结果
            CompletableFuture<Object> future = task1.thenCombineAsync(task2, (t1, t2) -> {
                return "邮件发送成功";
            });
        }
    

    方案二,Mq异步化处理,还是针对上述业务逻辑,我们是否可以将最终的发送邮件的动作剥离出来,最终再去统一执行发送邮件。

    mqAsync转存失败,建议直接上传图片文件

    关于伪代码这里不展开了,有兴趣的小伙伴可以自行实现一下。

    总结

    虽然有时候业务催的确实比较急,我们也不得不加班加点赶工撸代码。但是我们不能由于这样的原因而舍弃对系统性能的追求。有人说反正这个项目我后面不维护的,坑的话还是留一个下一个人去解决吧,代码能跑就行,在此老猫还是想奉劝一句“研发何必为难研发”。在日常开发的过程中不仅仅是上面这样的大事务问题,其实还有很多优化的点,例如对象的创建,接口幂等,重试容错等等。后续老猫会持续分享近年来的经验,可能不是最好的,但是希望对你有用,当然也希望大家能够给出宝贵建议,欢迎大家持续关注。

    相关文章

    Oracle如何使用授予和撤销权限的语法和示例
    Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
    下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
    社区版oceanbase安装
    Oracle 导出CSV工具-sqluldr2
    ETL数据集成丨快速将MySQL数据迁移至Doris数据库

    发布评论