点击上方“IT那活儿”公众号--专注于企业全栈运维技术分享,不管IT什么活儿,干就完了!!! MySQL 主从复制是一种常见的数据库架构,用于提高数据库的可用性和性能。但是,在实际应用中,主从故障是难免的。本文详细介绍一套MySQL主从故障排查方案。
一
确认主从状态
首先要确定主从复制的状态,可以通过执行以下命令来检查:1)SHOW MASTER STATUS; 命令用于显示主库的状态信息,包括以下列:
- File: 当前正在写入的二进制日志文件名。
- Position: 文件中当前正在写入的位置。
- Binlog_Do_DB: 主库正在复制的数据库列表。
- Binlog_Ignore_DB: 主库正在忽略复制的数据库列表。
2)SHOW SLAVE STATUS; 命令用于显示从库的状态信息,包括以下列:
- Slave_IO_State: 从库的 I/O 线程的当前状态。
- Master_Host: 主库的主机名或 IP 地址。
- Master_User: 从库用于连接主库的用户名。
- Master_Port: 主库的端口号。
- Connect_Retry: 从库尝试连接到主库的次数。
- Master_Log_File: 主库当前正在写入的二进制日志文件名。
- Read_Master_Log_Pos: 从库当前读取的主库二进制日志位置。
- Relay_Log_File: 从库正在写入的中继日志文件名。
- Relay_Log_Pos: 从库当前写入的中继日志位置。
- Relay_Master_Log_File: 从库当前读取的主库二进制日志文件名。
- Slave_IO_Running: 从库的 I/O 线程是否正在运行。
- Slave_SQL_Running: 从库的 SQL 线程是否正在运行。
- Last_Errno: 最后一个复制错误的错误码。
- Last_Error: 最后一个复制错误的错误信息。
- Seconds_Behind_Master: 从库与主库之间的复制延迟时间(秒)。
这些信息可以帮助确定主从复制的状态,检查复制是否正常运行以及是否存在任何错误或延迟。
二
检查网络连接
检查主库和从库之间的网络连接是否正常,可以使用 ping 命令或 telnet 命令来测试主从服务器之间的连通性。
- ping 主库IP地址。
- telnet 主库IP地址 3306。
如果网络连接正常,可以继续排查其他可能的问题。
三
检查主库状态
在主库上执行以下命令来检查主库的状态:1)SHOW PROCESSLIST; 命令用于显示当前正在运行的 MySQL 进程列表,包括以下列:
- Id: 进程的唯一标识符。
- User: 进程所属的用户。
- Host: 进程连接的主机名或 IP 地址。
- db: 进程正在使用的数据库。
- Command: 进程正在执行的命令类型。
- Time: 进程运行的时间(秒)。
- State: 进程的当前状态。
- Info: 进程正在执行的具体 SQL 语句。
这些信息可以帮助确定当前正在运行的查询、连接和执行时间,以及进程的状态。2)SHOW ENGINE INNODB STATUS; 命令用于显示 InnoDB 存储引擎的状态信息它提供了一个详细的报告,包含以下部分:
- SEMAPHORES: 信号量的状态信息。
- TRANSACTIONS: 事务的状态信息。
- FILE I/O: 文件 I/O 操作的状态信息。
- INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
- LOG: 日志的状态信息。
- BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
- ROW OPERATIONS: 行操作的状态信息。
- SEMAPHORES: 信号量的状态信息。
- TRANSACTIONS: 事务的状态信息。
- FILE I/O: 文件 I/O 操作的状态信息。
- INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
- LOG: 日志的状态信息。
- BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
- ROW OPERATIONS: 行操作的状态信息。
- TRANSACTIONS: 事务的状态信息。
- FILE I/O: 文件 I/O 操作的状态信息。
- INSERT BUFFER AND ADAPTIVE HASH INDEX: 插入缓冲区和自适应哈希索引的状态信息。
- LOG: 日志的状态信息。
- BUFFER POOL AND MEMORY: 缓冲池和内存的状态信息。
- ROW OPERATIONS: 行操作的状态信息。
这些信息可以用于分析和诊断 InnoDB 存储引擎的性能和问题。
四
检查从库状态
在从库上执行以下命令来检查从库的状态:
SHOW SLAVE STATUS;
检查 Seconds_Behind_Master 的值,如果该值为 0,则表示从库与主库同步正常。如果该值不为 0,则表示从库与主库之间存在延迟。
五
检查错误日志
检查主库和从库的错误日志,查看是否有任何错误或警告信息。可以通过执行以下命令来查看错误日志的位置:
SHOW VARIABLES LIKE 'log_error';
然后,使用文本编辑器打开错误日志文件,查找其中的错误或警告信息。重启主从服务:如果以上步骤没有找到问题,可以尝试重启主从服务。首先停止从库的复制进程,然后停止主库的 MySQL 服务,最后按照正确的顺序启动主从服务。
STOP SLAVE;
STOP MASTER;
START MASTER;
START SLAVE;
重启服务后,再次检查主从状态和复制日志,确保复制正常。数据一致性检查:如果主从复制仍然存在问题,可以执行数据一致性检查。可以使用 Percona Toolkit 或其他工具来比较主库和从库之间的数据差异,并尝试修复数据不一致的问题。以上是一套详细的 MySQL 主从故障排查方案。根据具体情况,可能需要进行更多的排查步骤或使用其他工具来解决问题。
END