openGauss5.1数据库管理指南:创建和管理分区表

2023年 10月 24日 45.9k 0

背景信息

openGauss数据库支持的分区表为范围分区表、列表分区表、哈希分区表。

  • 范围分区表:将数据基于范围映射到每一个分区,这个范围是由创建分区表时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期,例如将销售数据按照月份进行分区。
  • 列表分区表:将数据中包含的键值分别存储在不同的分区中,依次将数据映射到每一个分区,分区中包含的键值由创建分区表时指定。
  • 哈希分区表:将数据根据内部哈希算法依次映射到每一个分区中,包含的分区个数由创建分区表时指定。

分区表和普通表相比具有以下优点:

  • 改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索效率。
  • 增强可用性:如果分区表的某个分区出现故障,表在其他分区的数据仍然可用。
  • 方便维护:如果分区表的某个分区出现故障,需要修复数据,只修复该分区即可。
  • 均衡I/O:可以把不同的分区映射到不同的磁盘以平衡I/O,改善整个系统性能。

普通表若要转成分区表,需要新建分区表,然后把普通表中的数据导入到新建的分区表中。因此在初始设计表时,请根据业务提前规划是否使用分区表。

操作步骤

示例一:使用默认表空间

  • 创建分区表(假设用户已创建tpcds schema)

    postgres=# CREATE TABLE tpcds.customer_address
    (
    ca_address_sk integer NOT NULL ,
    ca_address_id character(16) NOT NULL ,
    ca_street_number character(10) ,
    ca_street_name character varying(60) ,
    ca_street_type character(15) ,
    ca_suite_number character(10) ,
    ca_city character varying(60) ,
    ca_county character varying(30) ,
    ca_state character(2) ,
    ca_zip character(10) ,
    ca_country character varying(20) ,
    ca_gmt_offset numeric(5,2) ,
    ca_location_type character(20)
    )
    PARTITION BY RANGE (ca_address_sk)
    (
    PARTITION P1 VALUES LESS THAN(5000),
    PARTITION P2 VALUES LESS THAN(10000),
    PARTITION P3 VALUES LESS THAN(15000),
    PARTITION P4 VALUES LESS THAN(20000),
    PARTITION P5 VALUES LESS THAN(25000),
    PARTITION P6 VALUES LESS THAN(30000),
    PARTITION P7 VALUES LESS THAN(40000),
    PARTITION P8 VALUES LESS THAN(MAXVALUE)
    )
    ENABLE ROW MOVEMENT;

    当结果显示为如下信息,则表示创建成功。

    CREATE TABLE

     说明: 创建列存分区表的数量建议不超过1000个。

  • 插入数据

    将表tpcds.customer_address的数据插入到表tpcds.web_returns_p2中。

    例如在数据库中创建了一个表tpcds.customer_address的备份表tpcds.web_returns_p2,现在需要将表tpcds.customer_address中的数据插入到表tpcds.web_returns_p2中,则可以执行如下命令。

    postgres=# CREATE TABLE tpcds.web_returns_p2
    (
    ca_address_sk integer NOT NULL ,
    ca_address_id character(16) NOT NULL ,
    ca_street_number character(10) ,
    ca_street_name character varying(60) ,
    ca_street_type character(15) ,
    ca_suite_number character(10) ,
    ca_city character varying(60) ,
    ca_county character varying(30) ,
    ca_state character(2) ,
    ca_zip character(10) ,
    ca_country character varying(20) ,
    ca_gmt_offset numeric(5,2) ,
    ca_location_type character(20)
    )
    PARTITION BY RANGE (ca_address_sk)
    (
    PARTITION P1 VALUES LESS THAN(5000),
    PARTITION P2 VALUES LESS THAN(10000),
    PARTITION P3 VALUES LESS THAN(15000),
    PARTITION P4 VALUES LESS THAN(20000),
    PARTITION P5 VALUES LESS THAN(25000),
    PARTITION P6 VALUES LESS THAN(30000),
    PARTITION P7 VALUES LESS THAN(40000),
    PARTITION P8 VALUES LESS THAN(MAXVALUE)
    )
    ENABLE ROW MOVEMENT;
    CREATE TABLE
    postgres=# INSERT INTO tpcds.web_returns_p2 SELECT * FROM tpcds.customer_address;
    INSERT 0 0

  • 修改分区表行迁移属性

    postgres=# ALTER TABLE tpcds.web_returns_p2 DISABLE ROW MOVEMENT;
    ALTER TABLE

  • 删除分区

    删除分区P8。

    postgres=# ALTER TABLE tpcds.web_returns_p2 DROP PARTITION P8;
    ALTER TABLE

  • 增加分区

    增加分区P8,范围为 40000

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论