MySQL 主从故障排查

2023年 12月 25日 107.7k 0

点击上方“IT那活儿”公众号--专注于企业全栈运维技术分享,不管IT什么活儿,干就完了!!!  MySQL 主从复制是一种常见的数据库架构,用于提高数据库的可用性和性能。但是,在实际应用中,主从故障是难免的。本文详细介绍一套MySQL主从故障排查方案。

确认主从状态

首先要确定主从复制的状态,可以通过执行以下命令来检查:1)SHOW MASTER STATUS; 命令用于显示主库的状态信息,包括以下列:

  • File: 当前正在写入的二进制日志文件名。
  • Position: 文件中当前正在写入的位置。
  • Binlog_Do_DB: 主库正在复制的数据库列表。
  • Binlog_Ignore_DB: 主库正在忽略复制的数据库列表。

2)SHOW SLAVE STATUS; 命令用于显示从库的状态信息,包括以下列:

  • Slave_IO_State: 从库的 I/O 线程的当前状态。
  • Master_Host: 主库的主机名或 IP 地址。
  • Master_User: 从库用于连接主库的用户名。
  • Master_Port: 主库的端口号。
  • Connect_Retry: 从库尝试连接到主库的次数。
  • Master_Log_File: 主库当前正在写入的二进制日志文件名。
  • Read_Master_Log_Pos: 从库当前读取的主库二进制日志位置。
  • Relay_Log_File: 从库正在写入的中继日志文件名。
  • Relay_Log_Pos: 从库当前写入的中继日志位置。
  • Relay_Master_Log_File: 从库当前读取的主库二进制日志文件名。
  • Slave_IO_Running: 从库的 I/O 线程是否正在运行。
  • Slave_SQL_Running: 从库的 SQL 线程是否正在运行。
  • Last_Errno: 最后一个复制错误的错误码。
  • Last_Error: 最后一个复制错误的错误信息。
  • Seconds_Behind_Master: 从库与主库之间的复制延迟时间(秒)。

这些信息可以帮助确定主从复制的状态,检查复制是否正常运行以及是否存在任何错误或延迟。

检查网络连接

检查主库和从库之间的网络连接是否正常,可以使用 ping 命令或 telnet 命令来测试主从服务器之间的连通性。

  • ping 主库IP地址。
  • telnet 主库IP地址 3306。

如果网络连接正常,可以继续排查其他可能的问题。

检查主库状态

在主库上执行以下命令来检查主库的状态:1)SHOW PROCESSLIST; 命令用于显示当前正在运行的 MySQL 进程列表,包括以下列:

  • Id: 进程的唯一标识符。
  • User: 进程所属的用户。
  • Host: 进程连接的主机名或 IP 地址。
  • db: 进程正在使用的数据库。
  • Command: 进程正在执行的命令类型。
  • Time: 进程运行的时间(秒)。
  • State: 进程的当前状态。
  • Info: 进程正在执行的具体 SQL 语句。

这些信息可以帮助确定当前正在运行的查询、连接和执行时间,以及进程的状态。2)SHOW ENGINE INNODB STATUS; 命令用于显示 InnoDB 存储引擎的状态信息它提供了一个详细的报告,包含以下部分:

  • SEMAPHORES: 信号量的状态信息。
  • TRANSACTIONS: 事务的状态信息。
  • FILE I/O: 文件 I/O 操作的状态信息。
  • INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
  • LOG: 日志的状态信息。
  • BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
  • ROW OPERATIONS: 行操作的状态信息。
  • SEMAPHORES: 信号量的状态信息。
  • TRANSACTIONS: 事务的状态信息。
  • FILE I/O: 文件 I/O 操作的状态信息。
  • INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
  • LOG: 日志的状态信息。
  • BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
  • ROW OPERATIONS: 行操作的状态信息。
  • TRANSACTIONS: 事务的状态信息。
  • FILE I/O: 文件 I/O 操作的状态信息。
  • INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
  • LOG: 日志的状态信息。
  • BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
  • ROW OPERATIONS: 行操作的状态信息。

这些信息可以用于分析和诊断 InnoDB 存储引擎的性能和问题。

检查从库状态

在从库上执行以下命令来检查从库的状态:

SHOW SLAVE STATUS;

检查 Seconds_Behind_Master 的值,如果该值为 0,则表示从库与主库同步正常。如果该值不为 0,则表示从库与主库之间存在延迟。

检查错误日志

检查主库和从库的错误日志,查看是否有任何错误或警告信息。可以通过执行以下命令来查看错误日志的位置:

SHOW VARIABLES LIKE 'log_error';

然后,使用文本编辑器打开错误日志文件,查找其中的错误或警告信息。重启主从服务:如果以上步骤没有找到问题,可以尝试重启主从服务。首先停止从库的复制进程,然后停止主库的 MySQL 服务,最后按照正确的顺序启动主从服务。

STOP SLAVE;
STOP MASTER;
START MASTER;
START SLAVE;

重启服务后,再次检查主从状态和复制日志,确保复制正常。数据一致性检查:如果主从复制仍然存在问题,可以执行数据一致性检查。可以使用 Percona Toolkit 或其他工具来比较主库和从库之间的数据差异,并尝试修复数据不一致的问题。以上是一套详细的 MySQL 主从故障排查方案。根据具体情况,可能需要进行更多的排查步骤或使用其他工具来解决问题。
END

本文作者:梁志谊(上海新炬中北团队)

本文来源:“IT那活儿”公众号

相关文章

Oracle如何使用授予和撤销权限的语法和示例
Awesome Project: 探索 MatrixOrigin 云原生分布式数据库
下载丨66页PDF,云和恩墨技术通讯(2024年7月刊)
社区版oceanbase安装
Oracle 导出CSV工具-sqluldr2
ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论