功能介绍
全量迁移gs_mysync是一个用Python3编写的将MySQL迁移至openGauss的复制工具,支持初始全量数据的复制功能。gs_mysync通过一次初始化配置,使用只读模式,将MySQL的数据全量拉取到openGauss。支持在同一快照下,表间数据并行迁移。
全量迁移支持的功能:支持表及表数据、视图、触发器、自定义函数、存储过程的全量迁移
特性优势
基于sysbench测试模型,2路鲲鹏920 CPU、openEuler操作系统下,MySQL数据库10张表(无主键)单表数据量在500万以上时,gs_mysync使用20并发迁移数据至openGauss,整体全量迁移性能可达300M/s以上。
环境准备
ARM+openEuler 20.03 或 X86+CentOS 7
操作步骤
全量迁移gs_mysync依赖MySQL一键式迁移工具gs_rep_portal,可实现全量迁移的安装、启动、停止、卸载整个过程。
如果用户的系统版本不在以下版本中,则内网场景下可能无法安装portal,此时安装portal需要保证pip3 install功能可用,可以连接外部网络的场景下安装portal不受系统版本影响。
各系统版本和架构对应的portal下载链接如下:
系统名称 | 系统架构 | 下载链接 |
---|---|---|
centos7 | x86_64 | https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/centos7/PortalControl-5.1.0-x86_64.tar.gz |
openEuler20.03 | x86_64 | https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler20.03/PortalControl-5.1.0-x86_64.tar.gz |
openEuler20.03 | aarch64 | https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler20.03/PortalControl-5.1.0-aarch64.tar.gz |
openEuler22.03 | x86_64 | https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler22.03/PortalControl-5.1.0-x86_64.tar.gz |
openEuler22.03 | aarch64 | https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/openEuler22.03/PortalControl-5.1.0-aarch64.tar.gz |
-
根据系统版本下载对应版本的portal(这里以centos系统x86架构为例)
wget https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/centos7/PortalControl-5.1.0-x86_64.tar.gz
解压,并进入portal对应目录
tar -zxvf PortalControl-5.1.0-x86_64.tar.gz
cd portal
-
修改gs_rep_portal配置文件
配置文件位于config目录内,全量迁移相关的配置文件主要包含如下两个,相关参数含义简要说明如下:
- toolspath.properties
# 迁移工具的版本号
tools.version=5.1.0
# 系统名称
system.name=centos7
# 系统架构
system.arch=x86_64
# 全量迁移工具整体的安装路径
chameleon.install.path=/ops/portal/tools/chameleon/
# 全量迁移python虚拟环境的路径,可自定义修改
chameleon.venv.path=/ops/portal/tools/chameleon/chameleon-${tools.version}/
# 全量迁移用户相关路径
chameleon.path=~/.pg_chameleon/
# 全量迁移tar包的下载路径
chameleon.pkg.url=https://opengauss.obs.cn-south-1.myhuaweicloud.com/latest/tools/${system.name}/chameleon-${tools.version}-${system.arch}.tar.gz
# 全量迁移安装包的路径,可自定义修改
chameleon.pkg.path=/ops/portal/pkg/chameleon/
# 全量迁移安装包的名称
chameleon.pkg.name=chameleon-${tools.version}-${system.arch}.tar.gz
- migrationConfig.properties
# 用于指定全量迁移是否迁移对象,包括函数、存储过程、触发器、视图,默认为yes;若设置为no,表示不迁移对象
snapshot.object=yes
# mysql用户名
mysql.user.name=root
# mysql密码
mysql.user.password=***
# mysql数据库ip
mysql.database.host=127.0.0.1
# mysql数据库端口
mysql.database.port=3306
# mysql数据库名称
mysql.database.name=test123
# openGauss用户名
opengauss.user.name=test
# openGauss密码
opengauss.user.password=***
# openGauss数据库ip
opengauss.database.host=127.0.0.1
# openGauss数据库端口
opengauss.database.port=5432
# openGauss数据库名称
opengauss.database.name=test1234
# openGauss数据库的schema名称
opengauss.database.schema=test123
# 全量迁移的安装方式,默认为offline,表示离线安装,需通过参数chameleon.pkg.path指定离线安装包的路径;若设置为online,对应在线安装,在线下载的安装包将存放在参数chameleon.pkg.path指定的路径
default.install.mysql.full.migration.tools.way=offline
- chameleon/config-example.yml
除上述的基础参数外,工具自身还有一些高级参数,详情请参见配置参数说明
-
安装
sh gs_mysync.sh install workspace.id
其中workspace.id表示迁移任务id,取值为数字和小写字母的组合,不同的id区分不同的迁移任务,不同迁移任务可并行启动。若未设置workspace.id,则使用其默认值1。若使用已存在的workspace.id,并修改其中的配置,请在portal/workspace/${workspace.id}/config/路径下修改对应的配置文件。
-
启动
sh gs_mysync.sh start workspace.id
-
停止
sh gs_mysync.sh stop workspace.id
-
卸载
sh gs_mysync.sh uninstall workspace.id
上述安装、启动、停止、卸载命令均不会在后台运行,若需在后台运行,请在命令后添加&符号。