MySQL性能优化盲区(高并发情况下,事务内的数据先更新还是先查询?)

2024年 3月 15日 59.3k 0

近期看到了一个前阿里资深开发的学术分析视频:
高并发情况下,一个事务内有更新操作还有查询操作,那是先更新好,还是先无锁查询好?
仅70秒的视频,深感学问太深,但是海哥讲的有待补充,于是写下了这篇文章,作为补充。

鸣谢:前阿里资深开发极海Channel的技术分享。

先说答案

这是个开放性的问题,必须看业务场景,抛开业务场景谈架构设计,都是耍流氓。

  • 场景1:如果update语句的参数操作依赖于查询操作,那么必须先查询,再更新,否则update语句的参数都凑不齐。
  • 场景2:如果update语句的参数操作不依赖于查询操作,但两个操作的是一张表,业务强制要求select获取的数据必须是最新的,则也需要先更新再读取。
  • 场景3:以上两种情况除外,则优先考虑先查询再更新。

场景1受参数限制,顺序毋庸置疑。
场景2受业务限制,顺序毋庸置疑。
场景3是为了性能优化,才去选择的方案。

测试表

CREATE TABLE `cs` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '数字列',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (1, 1);
INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (2, 2);
INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (3, 3);


假设场景2的代码如下:
start transaction;
update cs set num = 13 where id = 1;
SELECT * FROM `cs`;
commit;


场景3的代码如下:
start transaction;
SELECT * FROM `cs`;
update cs set num = 13 where id = 1;
commit;

对场景2,同一个事务内,先执行update,事务没提交,能读取到最新的数据吗?

能。

步骤 SQL 补充
1 start transaction; 开启事务
2 select num from cs where id = 1; num值是1
3 update cs set num = 12 where id = 1; 更新num值为12
4 select num from cs where id = 1; num值是12
5 rollback; 回滚事务

都说不加锁的select是快照读,为什么select还能读取当前事务的最新数据?

根据现象反推,个人认为:
不加锁的select是快照读,针对的是事务之外的不加锁的select,MySQL RR的隔离级别,只要更新的事务未提交,其它事务就读取不到更改的新数据。
当前事务内的select,就是不加锁的当前读(个人称谓)。当然,真正的当前读概念是为了保证读的最新数据,必须加锁。

对场景3的性能优化原理分析

得知道4个前提:

  • 场景3的实现,不会影响业务和开发。
  • 因为select没有加S或X锁,所以不会阻塞。
  • update语句会上X锁,可能是行锁、间隙锁,或者表锁(受索引、where条件的影响),所以并发请求过来后,其它事务的update有被阻塞的可能。
  • 用事务,就需要InnoDB引擎,InnoDB引擎支持行级锁,如果确定update的X锁,在并发情况下锁定的范围没有交集,这种优化方式起不到作用,这意味着不会阻塞。
    • 如果先更新再查询:
      分析原理:
      事务A的update语句会上锁,并发情况下阻塞事务B的update操作,如果事务A的select是个慢查询,事务A的X锁释放需要等到事务提交,而不是update语句本身执行完毕,这就意味着事务A select的环节,X锁也未释放,从而阻塞其它事务的update,降低性能。
      实操模拟:
    步骤 事务A 事务B 补充
    1 start transaction; start transaction; 双方开启事务,模拟并发请求
    2 update cs set num = 1234 where id = 1; update cs set num = 1234; 两个不同where范围的update,模拟线上的场景
    3 / 阻塞 事务A的行X锁,阻塞了事务B的表X锁
    4 select * from cs where id = 1; 阻塞 这一步很重要,优化就是为了避免这一步的阻塞耗时,特别是慢查询
    5 commit; 阻塞 事务A提交
    6 / select * from cs where id = 1; 事务A完成,事务B不会再阻塞了
    7 / commit; 结束事务B
    • 如果先查询再更新:
      分析原理:事务A的select语句不会上锁,此时事务不会导致事务B阻塞,如果执行到事务A执行到update,才回去上X锁,直到事务提交锁资源释放,即使事务A的select是一个慢查询,也不会加大事务A释放锁资源的事件,进而减少事务B的阻塞时间。
      实操模拟:
    步骤 事务A 事务B 补充
    1 start transaction; start transaction; 双方开启事务,模拟并发请求
    2 select * from cs where id = 1; select * from cs where id = 1; 两个事务不加锁不阻塞,这一步的阻塞时间省了
    3 update cs set num = 1234 where id = 1; update cs set num = 1234; 两个事务更新
    4 / 阻塞 两个X锁范围有冲突,阻塞
    5 commit; 阻塞 事务A提交
    6 / commit; 事务B提交

    所以说,只要业务允许,调整SQL语句的执行顺序,高并发情况下,就能得到不小的性能提升,但是这一点很容易忽略。

    相关文章

    Oracle如何使用授予和撤销权限的语法和示例
    Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
    下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
    社区版oceanbase安装
    Oracle 导出CSV工具-sqluldr2
    ETL数据集成丨快速将MySQL数据迁移至Doris数据库

    发布评论