SQLServer Execpt和not in 性能区别

2023年 4月 17日 67.1k 0

主要讲 except 和 not in 的性能上的区别。 复制代码 代码如下: CREATE TABLE tb1(ID int) CREATE TABLE tb2(ID int) BEGIN TRAN DECLARE @i INT = 500 WHILE @i 0 begin INSERT INTO dbo.tb1 VALUES ( @i -- v - int ) SET @i = @i -1 e

主要讲 except 和 not in 的性能上的区别。 复制代码 代码如下: CREATE TABLE tb1(ID int) CREATE TABLE tb2(ID int) BEGIN TRAN DECLARE @i INT = 500 WHILE @i > 0 begin INSERT INTO dbo.tb1 VALUES ( @i -- v - int ) SET @i = @i -1 end COMMIT我测试的时候tb1 是1000,tb2 是500 复制代码 代码如下: DBCC FREESYSTEMCACHE ('ALL','default'); SET STATISTICS IO ON SET STATISTICS TIME on SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 SET STATISTICS IO OFF SET STATISTICS TIME OFF 执行计划: 复制代码 代码如下: SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; |--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID])) |--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC)) | |--Table Scan(OBJECT:([master1].[dbo].[tb2])) |--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC)) |--Table Scan(OBJECT:([master1].[dbo].[tb1])) 复制代码 代码如下: SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 |--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID])) |--Table Scan(OBJECT:([master1].[dbo].[tb2])) |--Nested Loops(Left Anti Semi Join) |--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL)) | |--Table Scan(OBJECT:([master1].[dbo].[tb1])) | |--Top(TOP EXPRESSION:((1))) | |--Table Scan(OBJECT:([master1].[dbo].[tb2])) |--Row Count Spool |--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL)) SQL Server 执行时间: CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。 (500 行受影响) 表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 表 'tb2'。扫描计数 1,逻辑读取 1 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 (6 行受影响) (1 行受影响) SQL Server 执行时间: CPU 时间 = 0 毫秒,占用时间 = 528 毫秒。 (500 行受影响) 表 'Worktable'。扫描计数 0,逻辑读取 0 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 表 'tb2'。扫描计数 3,逻辑读取 1002 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 表 'tb1'。扫描计数 1,逻辑读取 2 次,物理读取 0 次,预读 0 次,lob 逻辑读取 0 次,lob 物理读取 0 次,lob 预读 0 次。 (10 行受影响) (1 行受影响) SQL Server 执行时间: CPU 时间 = 16 毫秒,占用时间 = 498 毫秒。 SQL Server 执行时间: CPU 时间 = 0 毫秒,占用时间 = 0 毫秒。 结论:通过较多数据 和 较少数据的测试,在较少数据的情况下 not in 比 except 性能好,但是在较多数据情况下 execpt 比 not in 出色。 看执行计划可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的执行计划开可以得到优化。 如果大家有兴趣可以看看 not exists 的执行计划。建议: 大家不要迷信测试结果,因为所有的性能都是和执行计划密切相关的。而执行计划和统计数据又密不可分。 所以过度的迷信测试结果,可能会对生产库造成性能的影响达不到预期的性能效果。

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论