首页
热点
系统
数据
应用
网络
云运维
开发
linux中国
更多
自动化
安全
桌面
教程
Linux命令查询
话题
热点
系统
数据
应用
网络
云运维
开发
自动化
linux中国
注册登录
更多
安全
桌面
教程
linux命令查询
tablesample
Spark SQL 抽样函数 ——TABLESAMPLE 的坑点
最近需要实现一段 Spark SQL 逻辑,对数据集进行抽样指定的行数。由于数据集较大,刚开始的逻辑是,取窗口函数随机排序后 row_number 的前 n 行。但运行速度较慢,所…
数据运维
2024年 4月 22日
64.4k
spark
sql
tablesample