客户发给我一个SQL,让我看看,为什么执行几分钟没有执行完。
我第一眼看到SQL的时候,我也觉得很简单,优化过程也比较简单,但是带来的分析过程与经验还是值得分享的。
SQL语句如下:
update ap_receive_benefits_log
set orderstate= i_orderstate where
requestid = i_orderid;
但是这个SQL执行时被严重阻塞了
该SQL的执行计划
疑问1
发现执行计划key走的主键,但是细看行数,会发现是全表扫描了数据。
如果没有可用索引的情况下,执行计划为什么显示走的主键,而不是空的呢?
疑问2
这个SQL里的 i_orderid
字段会不会是表中的一个字段呢,如果不是字段,是哪里来的?
分析解决步骤如下
1. 确认表中的数据量约75万,这个UPDATE语句每天都需要执行很多次。
2. 查看表后,发现并没有 i_orderid 字段,很是奇怪。就想这个SQL怎么来的,让开发确认一下这个SQL的来源,我来确认执行计划。如果是mysql 5.6以上版本可以直接查看UPDATE的执行计划,发现这个语句没有利用任何索引。
3. 开发找了半天,确认程序没有这个语句。怎么办,好像成了‘没人认领的死尸’,开发确认不了,只能自己查了。
4. 使用 pt-query-digest 分析最近几个小时的慢查询,发现问题如下:
5. 有一个存储过程执行次数很多,响应时间也是也是最大,分析此过程,查看该存储过程:
6. 此存储过程执行情况:
7. 到此,通过查看存储过程,可以确认发生阻塞的语句是过程里调用的,把存储过程发给开发,再次得到确认。
8. 知道语句了,优化就简单了,先确认字段的基数(唯一性)。
9. 加上索引 alter table ap_receive_benefits_log idx_requestId(requestId); 后,这个UPDATE就可以走索引了,问题解决。
再次回应上面的疑问
疑问1
为什么update执行计划没有索引情况下,使用的主键?
这个因为update语句查看执行计划的时候显示用的是主键,全表更新就是聚集索引,把这个update语句换成select,执行计划就是key显示的空。以下是测试的例子:
update的时候执行计划
转成select语句执行计划
疑问2
为什么show processlist显示的是字段或者是变量名,误导了我的思路?
测试一下:
创建过程并调用,延迟结果
查看processlist的结果
从测试结果看到,过程调用有变量传参的时候,在processlist中显示的变量传参名,而不是表的字段名。