MySQL 8.0中窗口函数框架用法的介绍-每日运维

Oracle提供了很多窗口函数，在做一些数据统计工作时，非常实用。MySQL中同样支持窗口函数，杨老师写的这篇文章《新特性解读 | MySQL 8.0 窗口函数框架用法》就介绍了一些。

窗口函数其实就是一个分组窗口内部处理每条记录的函数，这个窗口也就是之前聚合操作的窗口。不同的是，聚合函数是把窗口关闭，给一个汇总的结果；而窗口函数是把窗口打开，给分组内每行记录求取对应的聚合函数值或者其他表达式的结果。

这篇文章重点关注窗口函数内的 frame 子句：frame 子句用来把窗口内的记录按照指定的条件打印出来，跟在 partition 和 order by 子句后面。frame 子句的语法为，

frame_clause: frame_units frame_extent frame_units: {ROWS | RANGE}

frame_extent: {frame_start | frame_between} frame_between: BETWEEN frame_start AND frame_end frame_start, frame_end: { CURRENT ROW | UNBOUNDED PRECEDING | UNBOUNDED FOLLOWING | expr PRECEDING | expr FOLLOWING }

这里分为两块，一块是 frame_units （框架单元），另外一块是 frame_extent （框架内容）

frame_units 框架单元有两个，一个是 rows，一个是 range。
rows 后面跟的内容为指定的行号，而 range 不同，range 是指的行内容。

框架内容看起来挺多分类，其实就一句话来表达：为了定义分组内对应行记录的边界值来求取对应的计算结果。

基于 t1 举例说明下，

mysql: ytt_80 > desc t1; +-------+------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +-------+------+------+-----+---------+-------+ | id | int | YES | | NULL | | | r1 | int | YES | | NULL | | | r2 | int | YES | | NULL | | +-------+------+------+-----+---------+-------+ 3 rows in set (0.00 sec)

mysql: ytt_80 > select * from t1; +------+------+------+ | id | r1 | r2 | +------+------+------+ | 2 | 1 | 1 | | 2 | 2 | 20 | | 2 | 3 | 30 | | 2 | 4 | 40 | | 3 | 3 | 3 | | 3 | 2 | 2 | | 3 | 10 | 20 | | 3 | 30 | 20 | | 1 | 1 | 1 | | 1 | 2 | 3 | | 1 | 3 | 4 | | 1 | 10 | 10 | | 1 | 15 | 20 | | 2 | 15 | 2 | | 3 | 15 | 5 | | 1 | 9 | 100 | +------+------+------+ 16 rows in set (0.00 sec)

1、CURRENT ROW

表示获取当前行记录，也就是边界是当前行，等值关系。

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc range current row ) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 1 | | 1 | 2 | 2 | | 1 | 3 | 3 | | 1 | 9 | 9 | | 1 | 10 | 10 | | 1 | 15 | 15 | +------+------+-----------+ 6 rows in set (0.00 sec)

这里我们求 ID 为 1 的分组记录，基于聚合函数 SUM 来对分组内的行记录按照一定的条件求和。其中 OVER 子句用来定义分区以及相关条件，这里表示只获取分组内排序字段的当前行记录，也就是字段 r1 对应的记录，这是最简单的场景。

2、UNBOUNDED PRECEDING

表示边界永远为第一行。

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc rows unbounded preceding ) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 1 | | 1 | 2 | 3 | | 1 | 3 | 6 | | 1 | 9 | 15 | | 1 | 10 | 25 | | 1 | 15 | 40 | +------+------+-----------+ 6 rows in set (0.00 sec)

以上 unbounded preceding 用来获取表 t1 按照字段 ID 来分组，并且对字段 r1 求和。由于都是以第一行，也就是 r1 = 1 为基础求和，也就是求取上一行和当前行相加的结果，基于第一行记录。这个例子中 r1 字段的第一行记录为 1，后面的所有求和都是基于第一行来累加的结果。

3、unbounded following

表示边界永远为最后一行。

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc rows between unbounded preceding and unbounded following ) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 40 | | 1 | 2 | 40 | | 1 | 3 | 40 | | 1 | 9 | 40 | | 1 | 10 | 40 | | 1 | 15 | 40 | +------+------+-----------+ 6 rows in set (0.00 sec)

以上用了 rows between 把边界局限在第一行和最后一行，这样每行的求和结果和不带边界一样，也就是下面查询，

mysql: ytt_80 > select id,r1,sum(r1) over() as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 40 | | 1 | 2 | 40 | | 1 | 3 | 40 | | 1 | 10 | 40 | | 1 | 15 | 40 | | 1 | 9 | 40 | +------+------+-----------+ 6 rows in set (0.00 sec)

4、expr preceding following

带表达式的边界。

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc rows 1 preceding) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 1 | | 1 | 2 | 3 | | 1 | 3 | 5 | | 1 | 9 | 12 | | 1 | 10 | 19 | | 1 | 15 | 25 | +------+------+-----------+ 6 rows in set (0.00 sec)

带表达式的边界只是把无边界换成具体的行号。上面的查询表达的意思是基于分组内每行记录和它上一条记录求和，不累加。可以看到 wf_result 的具体值，25 对应的是 10 和 15 求和，19 对应的是 9 和 10 求和。

那以此类推，求每行和它上面两行的和，

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc rows 2 preceding) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 1 | | 1 | 2 | 3 | | 1 | 3 | 6 | | 1 | 9 | 14 | | 1 | 10 | 22 | | 1 | 15 | 34 | +------+------+-----------+ 6 rows in set (0.00 sec)

再来求每行的前两行和后面四行相加的结果，

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc rows between 2 preceding and 4 following) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 25 | | 1 | 2 | 40 | | 1 | 3 | 40 | | 1 | 9 | 39 | | 1 | 10 | 37 | | 1 | 15 | 34 | +------+------+-----------+ 6 rows in set (0.00 sec)

其实 rows 单元很简单，接下来看下 range ，range 稍微难理解些。

5、range preceding following

求当前行值范围内的分组记录。这个没有 rows 好理解，rows 对应的是行号，range 对应的行值。看下面例子，

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc range 1 preceding) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 1 | | 1 | 2 | 3 | | 1 | 3 | 5 | | 1 | 9 | 9 | | 1 | 10 | 19 | | 1 | 15 | 15 | +------+------+-----------+ 6 rows in set (0.00 sec)

这个例子包含的关键词 range 1 preceding ，是个表达式条件，表示对于分组内每一行来讲：以字段 r1 当前行值减去1的结果为边界来求和。具体点就是：第一行，r1 的值为 1，那 1-1=0，由于表 t1 里没有找到 r1 = 0 的结果，所以此时 wf_result = 1，也就是等于当前行值；对于第五行，由于 r1 对应的值为 10 , 10 - 1 = 9 ,表 t1 里 r1 = 9 是存在的，此时求和结果为 9 + 10 = 19。

再次带上范围来看下另外一个例子，

mysql: ytt_80 > select id,r1,sum(r1) over(partition by id order by r1 asc range between 1 preceding and 1 following) as wf_result from t1 where id = 1; +------+------+-----------+ | id | r1 | wf_result | +------+------+-----------+ | 1 | 1 | 3 | | 1 | 2 | 6 | | 1 | 3 | 5 | | 1 | 9 | 19 | | 1 | 10 | 19 | | 1 | 15 | 15 | +------+------+-----------+ 6 rows in set (0.00 sec)

这个例子 over 子句里指定一个边界范围，也就是对每行值减1和加1后对应的记录来求和。比如第一行：r1 = 1,1 -1 =0,1+1 =2，表 t1 没有 r1 = 0 的记录，但是有 r1 = 2 的记录，所以第一行的窗口求和结果为 3；再来看看 r1 = 10 的这行，10-1 = 9,10+1 = 11，表 t1 里有 r1 = 9 的记录，没有 r1 = 11 的记录，所以这里的求和结果为 9+10=19。

这里举例说明了 MySQL 8.0 窗口函数 frame 子句的用法，可能使用场景比较稀少，不过还是可以收藏起来以备不时之需。

如果您认为这篇文章有些帮助，还请不吝点下文章末尾的"点赞"和"在看"，或者直接转发pyq，

近期更新的文章：《Linux删除大量小文件的两种方案场景介绍》
《MySQL数据导入方案场景推荐》《最近很火的"切尔西北伐"》《GB和GB/T的含义》《Oracle数据库日常巡检指令》
近期的热文：《推荐一篇Oracle RAC Cache Fusion的经典论文》
《"红警"游戏开源代码带给我们的震撼》
文章分类和索引：《公众号1300篇文章分类和索引》

MySQL 8.0中窗口函数框架用法的介绍

1、CURRENT ROW

2、UNBOUNDED PRECEDING

3、unbounded following

4、expr preceding following

5、range preceding following

相关文章

发布评论取消回复

LOVEHL^ˇ^

如何使用 WinGet 下载 Microsoft Store 应用

下载丨66页PDF，云和恩墨技术通讯（2024年7月刊）

ETL数据集成丨快速将MySQL数据迁移至Doris数据库

MySQL 8.0中窗口函数框架用法的介绍

1、CURRENT ROW

2、UNBOUNDED PRECEDING

3、unbounded following

4、expr preceding following

5、range preceding following

相关文章

发布评论 取消回复

LOVEHL^ˇ^

如何使用 WinGet 下载 Microsoft Store 应用

下载丨66页PDF，云和恩墨技术通讯（2024年7月刊）

ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论取消回复