背景信息
openGauss资源负载管理的核心是资源池,而配置资源池首先要在环境中实现控制组Cgroups的设置。更多Cgroups的原理介绍,请查看相关操作系统的产品手册。openGauss的控制组请参考查看控制组的信息。
Class控制组为数据库业务运行所在的顶层控制组,集群部署时会自动生成默认子Class控制组“DefaultClass”。DefaultClass的Medium控制组会含有系统触发的作业在运行,该控制组不允许进行资源修改,且运行在该控制组上的作业不受资源管理的控制,所以推荐创建新的子Class及其Workload控制组来设置资源比例。
前提条件
已熟悉《工具与命令参考》中“服务端工具 > gs_cgroup”章节和“服务端工具 > gs_ssh”章节的使用。
操作步骤
说明:
- 在openGauss中,需要在每个集群节点上执行控制组的创建、更新、删除操作,才能实现对整个集群资源的控制,所以下述步骤中都使用《工具与命令参考》中“服务端工具 > gs_ssh”命令执行。
- 控制组的命名要求如下:
- 无论是子Class控制组还是Workload控制组,都不允许在名称中包含字符“:”。
- 不可以创建同名的控制组。
创建子Class控制组和Workload控制组
-
以操作系统用户omm登录openGauss主节点。
-
创建名称为“class_a”和“class_b”的子Class控制组,CPU资源配额分别为Class的40%和20%。
gs_ssh -c "gs_cgroup -c -S class_a -s 40"
gs_ssh -c "gs_cgroup -c -S class_b -s 20"
-
创建子Class控制组“class_a”下名称为“workload_a1”和“workload_a2”的Workload控制组,CPU资源配额分别为“class_a”控制组的20%和60%。
gs_ssh -c "gs_cgroup -c -S class_a -G workload_a1 -g 20 "
gs_ssh -c "gs_cgroup -c -S class_a -G workload_a2 -g 60 "
-
创建子Class控制组“class_b”下名称为“workload_b1”和“workload_b2”的Workload控制组,CPU资源配额分别为“class_b”控制组的50%和40%。
gs_ssh -c "gs_cgroup -c -S class_b -G workload_b1 -g 50 "
gs_ssh -c "gs_cgroup -c -S class_b -G workload_b2 -g 40 "
更新控制组的资源配额
-
更新“class_a”控制组的CPU资源配额为30%。
gs_ssh -c "gs_cgroup -u -S class_a -s 30"
-
更新“class_a”下的“workload_a1”的CPU资源配额为“class_a”的30%。
gs_ssh -c "gs_cgroup -u -S class_a -G workload_a1 -g 30"
须知: 调整后的Workload控制组“workload_a1”占有的CPU资源不应大于其对应的子Class控制组“class_a”。并且,此名称不能是Timeshare Cgroup的默认名称,如“Low”、“Medium”、“High”或“Rush”。
删除控制组
-
删除控制组“class_a”。
gs_ssh -c "gs_cgroup -d -S class_a"
以上操作可以删除控制组“class_a”。
须知: root用户或者具有root访问权限的用户指定“-d” 和“-U username”删除普通用户“username”可访问的默认Cgroups。普通用户指定“-d”和“-S classname”可以删除已有的Class Cgroups。
查看控制组的信息
-
查看配置文件中控制组信息。
gs_cgroup -p
控制组配置信息
gs_cgroup -p
Top Group information is listed:
GID: 0 Type: Top Percent(%): 1000( 50) Name: Root Cores: 0-47
GID: 1 Type: Top Percent(%): 833( 83) Name: Gaussdb:omm Cores: 0-20
GID: 2 Type: Top Percent(%): 333( 40) Name: Backend Cores: 0-20
GID: 3 Type: Top Percent(%): 499( 60) Name: Class Cores: 0-20Backend Group information is listed:
GID: 4 Type: BAKWD Name: DefaultBackend TopGID: 2 Percent(%): 266(80) Cores: 0-20
GID: 5 Type: BAKWD Name: Vacuum TopGID: 2 Percent(%): 66(20) Cores: 0-20Class Group information is listed:
GID: 20 Type: CLASS Name: DefaultClass TopGID: 3 Percent(%): 166(20) MaxLevel: 1 RemPCT: 100 Cores: 0-20
GID: 21 Type: CLASS Name: class1 TopGID: 3 Percent(%): 332(40) MaxLevel: 2 RemPCT: 70 Cores: 0-20Workload Group information is listed:
GID: 86 Type: DEFWD Name: grp1:2 ClsGID: 21 Percent(%): 99(30) WDLevel: 2 Quota(%): 30 Cores: 0-5Timeshare Group information is listed:
GID: 724 Type: TSWD Name: Low Rate: 1
GID: 725 Type: TSWD Name: Medium Rate: 2
GID: 726 Type: TSWD Name: High Rate: 4
GID: 727 Type: TSWD Name: Rush Rate: 8Group Exception information is listed:
GID: 20 Type: EXCEPTION Class: DefaultClass
PENALTY: QualificationTime=1800 CPUSkewPercent=30GID: 21 Type: EXCEPTION Class: class1
PENALTY: AllCpuTime=100 QualificationTime=2400 CPUSkewPercent=90GID: 86 Type: EXCEPTION Group: class1:grp1:2
ABORT: BlockTime=1200 ElapsedTime=2400
上述示例查看到的控制组配置信息如表1所示。
表 1 控制组配置信息
GID
类型
名称
Percent(%)信息
特定信息
0
Top控制组
Root
1000代表总的系统资源为1000份。
括号中的50代表IO资源的50%。
openGauss不通过控制组对IO资源做控制,因此下面其他控制组信息中仅涉及CPU配额情况。
-
1
Gaussdb:omm
系统中只运行一套数据库程序,Gaussdb:omm控制组默认配额为833,数据库程序和非数据库程序的比值为(833:167=5:1)。
-
2
Backend
Backend和Class括号中的40和60,代表Backend占用Gaussdb:dbuser控制组40%的资源,Class占用Gaussdb:dbuser控制组60%的资源。
-
3
Class
-
4
Backend控制组
DefaultBackend
括号中的80和20代表DefaultBackend和Vacuum占用Backend控制组80%和20%的资源。
TopGID:代表Top类型控制组中Backend组的GID,即2。
5
Vacuum
20
Class控制组
DefaultClass
DefaultClass和class1的20和40代表占Class控制组20%和40%的资源。因为当前只有两个Class组,所有它们按照20:40的比例分配Class控制组499的系统配额,则分别为166和332。
- TopGID:代表DefaultClass和class1所属的上层控制(Top控制组中的Class组)的GID,即3。
- MaxLevel:Class组当前含有的Workload组的最大层次,DefaultClass没有Workload Cgroup,其数值为1。
- RemPCT:代表Class组分配Workload组后剩余的资源百分比。如class1中剩余的百分比为70。
21
class1
86
Workload控制组
grp1:2
(该名称由Workload Cgroup Name和其在class中的层级组成,它是class1的第一个Workload组,层级为2,每个Class组最多10层Workload Cgroup。)
根据设置,其占class1的百分比为30,则为332*30%=99。
- ClsGID:代表Workload控制组所属的上层控制组(class1控制组)的GID。
- WDLevel:代表当前Workload Cgroup在对应的Class组所在的层次。
724
Timeshare控制组
Low
-
Rate:代表Timeshare中的分配比例,Low最少为1,Rush最高为8。这四个Timeshare组的资源配比为Rush:High:Medium:Low=8:4:2:1
725
Medium
-
726
High
-
727
Rush
-
-
查看操作系统中树形结构的控制组信息。
执行如下命令可以查询控制组树形结构信息。
gs_cgroup -P
返回信息如下,其中shares代表操作系统中CPU资源的动态资源配额“cpu.shares”的数值,cpus代表操作系统中CPUSET资源的动态资源限额“cpuset.cpus”的数值,指的是该控制组能够使用的核数范围。
Mount Information:
cpu:/dev/cgroup/cpu
blkio:/dev/cgroup/blkio
cpuset:/dev/cgroup/cpuset
cpuacct:/dev/cgroup/cpuacctGroup Tree Information:
- Gaussdb:wangrui (shares: 5120, cpus: 0-20, weight: 1000)
- Backend (shares: 4096, cpus: 0-20, weight: 400)
- Vacuum (shares: 2048, cpus: 0-20, weight: 200)
- DefaultBackend (shares: 8192, cpus: 0-20, weight: 800)
- Class (shares: 6144, cpus: 0-20, weight: 600)
- class1 (shares: 4096, cpus: 0-20, weight: 400)
- RemainWD:1 (shares: 1000, cpus: 0-20, weight: 100)
- RemainWD:2 (shares: 7000, cpus: 0-20, weight: 700)
- Timeshare (shares: 1024, cpus: 0-20, weight: 500)
- Rush (shares: 8192, cpus: 0-20, weight: 800)
- High (shares: 4096, cpus: 0-20, weight: 400)
- Medium (shares: 2048, cpus: 0-20, weight: 200)
- Low (shares: 1024, cpus: 0-20, weight: 100)
- grp1:2 (shares: 3000, cpus: 0-5, weight: 300)
- TopWD:1 (shares: 9000, cpus: 0-20, weight: 900)
- DefaultClass (shares: 2048, cpus: 0-20, weight: 200)
- RemainWD:1 (shares: 1000, cpus: 0-20, weight: 100)
- Timeshare (shares: 1024, cpus: 0-20, weight: 500)
- Rush (shares: 8192, cpus: 0-20, weight: 800)
- High (shares: 4096, cpus: 0-20, weight: 400)
- Medium (shares: 2048, cpus: 0-20, weight: 200)
- Low (shares: 1024, cpus: 0-20, weight: 100)
- TopWD:1 (shares: 9000, cpus: 0-20, weight: 900)
-
通过系统视图获取控制组配置信息。
a.使用gsql访问openGauss数据库。
b.获取系统中所有控制组的配置信息。
openGauss=# SELECT * FROM gs_all_control_group_info;