MySQL性能优化盲区（高并发情况下，事务内的数据先更新还是先查询？）

数据运维 2024-03-15 宇宙之一粟手机阅读

近期看到了一个前阿里资深开发的学术分析视频：
高并发情况下，一个事务内有更新操作还有查询操作，那是先更新好，还是先无锁查询好？
仅70秒的视频，深感学问太深，但是海哥讲的有待补充，于是写下了这篇文章，作为补充。

鸣谢：前阿里资深开发极海Channel的技术分享。

先说答案

这是个开放性的问题，必须看业务场景，抛开业务场景谈架构设计，都是耍流氓。

场景1：如果update语句的参数操作依赖于查询操作，那么必须先查询，再更新，否则update语句的参数都凑不齐。
场景2：如果update语句的参数操作不依赖于查询操作，但两个操作的是一张表，业务强制要求select获取的数据必须是最新的，则也需要先更新再读取。
场景3：以上两种情况除外，则优先考虑先查询再更新。

场景1受参数限制，顺序毋庸置疑。
场景2受业务限制，顺序毋庸置疑。
场景3是为了性能优化，才去选择的方案。

测试表

CREATE TABLE `cs` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
  `num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '数字列',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=4 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;

INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (1, 1);
INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (2, 2);
INSERT INTO `temp`.`cs` (`id`, `num`) VALUES (3, 3);


假设场景2的代码如下：
start transaction;
update cs set num = 13 where id = 1;
SELECT * FROM `cs`;
commit;


场景3的代码如下：
start transaction;
SELECT * FROM `cs`;
update cs set num = 13 where id = 1;
commit;

对场景2，同一个事务内，先执行update，事务没提交，能读取到最新的数据吗？

能。

步骤	SQL	补充
1	start transaction;	开启事务
2	select num from cs where id = 1;	num值是1
3	update cs set num = 12 where id = 1;	更新num值为12
4	select num from cs where id = 1;	num值是12
5	rollback;	回滚事务

都说不加锁的select是快照读，为什么select还能读取当前事务的最新数据？

根据现象反推，个人认为：
不加锁的select是快照读，针对的是事务之外的不加锁的select，MySQL RR的隔离级别，只要更新的事务未提交，其它事务就读取不到更改的新数据。
当前事务内的select，就是不加锁的当前读（个人称谓）。当然，真正的当前读概念是为了保证读的最新数据，必须加锁。

对场景3的性能优化原理分析

得知道4个前提：

场景3的实现，不会影响业务和开发。

因为select没有加S或X锁，所以不会阻塞。

update语句会上X锁，可能是行锁、间隙锁，或者表锁（受索引、where条件的影响），所以并发请求过来后，其它事务的update有被阻塞的可能。

用事务，就需要InnoDB引擎，InnoDB引擎支持行级锁，如果确定update的X锁，在并发情况下锁定的范围没有交集，这种优化方式起不到作用，这意味着不会阻塞。

如果先更新再查询：
分析原理：
事务A的update语句会上锁，并发情况下阻塞事务B的update操作，如果事务A的select是个慢查询，事务A的X锁释放需要等到事务提交，而不是update语句本身执行完毕，这就意味着事务A select的环节，X锁也未释放，从而阻塞其它事务的update，降低性能。
实操模拟：

步骤	事务A	事务B	补充
1	start transaction;	start transaction;	双方开启事务，模拟并发请求
2	update cs set num = 1234 where id = 1;	update cs set num = 1234;	两个不同where范围的update，模拟线上的场景
3	/	阻塞	事务A的行X锁，阻塞了事务B的表X锁
4	select * from cs where id = 1;	阻塞	这一步很重要，优化就是为了避免这一步的阻塞耗时，特别是慢查询
5	commit;	阻塞	事务A提交
6	/	select * from cs where id = 1;	事务A完成，事务B不会再阻塞了
7	/	commit;	结束事务B

如果先查询再更新：
分析原理：事务A的select语句不会上锁，此时事务不会导致事务B阻塞，如果执行到事务A执行到update，才回去上X锁，直到事务提交锁资源释放，即使事务A的select是一个慢查询，也不会加大事务A释放锁资源的事件，进而减少事务B的阻塞时间。
实操模拟：

步骤	事务A	事务B	补充
1	start transaction;	start transaction;	双方开启事务，模拟并发请求
2	select * from cs where id = 1;	select * from cs where id = 1;	两个事务不加锁不阻塞，这一步的阻塞时间省了
3	update cs set num = 1234 where id = 1;	update cs set num = 1234;	两个事务更新
4	/	阻塞	两个X锁范围有冲突，阻塞
5	commit;	阻塞	事务A提交
6	/	commit;	事务B提交

所以说，只要业务允许，调整SQL语句的执行顺序，高并发情况下，就能得到不小的性能提升，但是这一点很容易忽略。

MySQL性能优化盲区（高并发情况下，事务内的数据先更新还是先查询？）

先说答案

测试表

对场景2，同一个事务内，先执行update，事务没提交，能读取到最新的数据吗？

都说不加锁的select是快照读，为什么select还能读取当前事务的最新数据？

对场景3的性能优化原理分析

MySQL双写缓冲机制：性能优化策略及实践经验分享

怎么看mysql装到什么位置

怎样登录mysql

MySQL的备份工具mysqldump的基础使用命令总结

我的世界mysql命令