Redis集群详解

开发运维 2023-10-07 泡泡手机阅读

系列文章目录

（一）Redis(windows+Linux)安装及入门教程 - 掘金 (juejin.cn)

（二）Redis中的五大数据类型 - 掘金 (juejin.cn)

（三）Redis中的三种特殊类型 - 掘金 (juejin.cn)

（四）Redis实现乐观锁 - 掘金 (juejin.cn)

（五）SpringBoot整合Redis详细教程 - 掘金 (juejin.cn)

（六）Redis配置文件详解以及持久化和订阅发布 - 掘金 (juejin.cn)

前言

本文记录了Redis集群搭建，主从配置，哨兵模式等内容的讲解，后续还会介绍Redis的缓存问题，缓存雪崩，穿透，击穿等问题，如果觉得本文对你有帮助的话可以🌯🌮🥪点赞+收藏+关注。

一、Redis主从复制🍟

概念

主从复制，是指将一台Redis服务器的数据，复制到其他的Redis服务器。前者称为主节点(master/leader)，后者称为从节点(slave/follower); 数据的复制是单向的，只能由主节点到从节点。Master以写为主，Slave 以读为主。

默认情况下，每台Redis服务器都是主节点，且一个主节点可以有多个从节点(或没有从节点)，但一个从节点只能有一个主节点。

主从复制的作用主要包括 :

数据冗余：主从复制实现了数据的热备份，是持久化之外的一种数据冗余方式。

故障恢复：当主节点出现问题时，可以由从节点提供服务，实现快速的故障恢复;实际上是一种服务的冗余.

负载均衡：在主从复制的基础上，配合读写分离，可以由主节点提供写服务，由从节点提供读服务(即写Redis数据时应用连按主节点，读Redis数据时应用连接从节点)，分担服务器负载；尤其是在写少读多的场景下，通过多个从节点分担读负载，可以大大提高Redis服务器的并发量。

高可用基石：除了上述作用以外，主从复制还是哨兵和集群能够实施的基础，因此说主从复制是Redis高可用的基础

一般来说工程项目中不会只使用一台Redis服务器：

从结构上，单个Redis服务器会发生单点故障，并且一台服务器需要处理所有的请求负载，压力较大;

从容量上，单个Redis服务器内存容量有限，就算一台Redis服务器内存容量为256G，也不能将所有内存用作Redis存储内存，一般来说，单台Redis最大使用内存不应该超过20G。

电商网站上，一般都是一次上传，多次浏览，就是多读少写

未命名文件

二、环境配置🥓

查看主从复制信息，只需要配置从节点，不需要配置主节点

127.0.0.1:6379> info replication
# Replication
role:master #主节点
connected_slaves:0 #连接的从机数量
master_failover_state:no-failover
master_replid:e7b2db100ed8d3d998f62b9f79265a52bd9de132
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:3
second_repl_offset:-1
repl_backlog_active:0
repl_backlog_size:1048576
repl_backlog_first_byte_offset:0
repl_backlog_histlen:0

创建从节点配置文件

[root@hecs-66133 selfconfig]# cp redis.conf redis79.conf 
[root@hecs-66133 selfconfig]# cp redis.conf redis80.conf 
[root@hecs-66133 selfconfig]# cp redis.conf redis81.conf 
[root@hecs-66133 selfconfig]# ls
redis79.conf  redis80.conf  redis81.conf  redis.conf

需要修改的地方：

port

pidfile

logfile

dbfilename

通过不同的配置文件分别启动三个redis服务

Redis集群详解-每日运维
**

三、主从配置🥗

******默认情况下，每台Redis服务器都是主节点；所以配置从机即可

配置一主（6379）二从（6380，6381）

从机80

127.0.0.1:6380> SLAVEOF 127.0.0.1 6379 #设置主机
OK
127.0.0.1:6380> info replication #查看主从复制信息
# Replication
role:slave #角色以及变为从机
master_host:127.0.0.1 #主机的信息
master_port:6379
master_link_status:up
master_last_io_seconds_ago:0
master_sync_in_progress:0
slave_read_repl_offset:17
slave_repl_offset:17
slave_priority:100
slave_read_only:1
replica_announced:1
connected_slaves:0
master_failover_state:no-failover
master_replid:19283b9c29f633c4636cc1a5a321ff50436b80c5
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:17
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:18
repl_backlog_histlen:0

从机81

127.0.0.1:6381> SLAVEOF 127.0.0.1 6379
OK
127.0.0.1:6381> info replication
# Replication
role:slave #角色以及变为从机
master_host:127.0.0.1
master_port:6379
master_link_status:up
master_last_io_seconds_ago:3
master_sync_in_progress:0
slave_read_repl_offset:409
slave_repl_offset:409
slave_priority:100
slave_read_only:1
replica_announced:1
connected_slaves:0
master_failover_state:no-failover
master_replid:19283b9c29f633c4636cc1a5a321ff50436b80c5
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:409
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:396
repl_backlog_histlen:14

主机79

127.0.0.1:6379> info replication
# Replication
role:master
connected_slaves:2 #从机连接数量
#从机相关信息
slave0:ip=127.0.0.1,port=6380,state=online,offset=423,lag=1
slave1:ip=127.0.0.1,port=6381,state=online,offset=423,lag=1
master_failover_state:no-failover
master_replid:19283b9c29f633c4636cc1a5a321ff50436b80c5
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:423
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:4
repl_backlog_histlen:420

真实的主从配置都是在配置文件中配置的，使用命令配置只是展示的，配置文件中配置才是永久的

配置文件中配置过后，默认就为从机。

细节

主机可以写，从机不能写只能读！主机中的所有信息和数据，都会被从机保存

主机写：

从机读：

主机下线，从机依旧连接到主机，但是没有写操作，如果此时主机重新上线，从机依旧可以直接获取主机写的信息。

主机下线：

127.0.0.1:6379> SHUTDOWN
not connected> exit

从机查看主从复制信息：

127.0.0.1:6380> info replication
# Replication
role:slave
master_host:127.0.0.1
master_port:6379
master_link_status:down #显示主机已经下线
master_last_io_seconds_ago:-1
master_sync_in_progress:0
slave_read_repl_offset:1981
slave_repl_offset:1981
master_link_down_since_seconds:28
slave_priority:100
slave_read_only:1
replica_announced:1
connected_slaves:0
master_failover_state:no-failover
master_replid:19283b9c29f633c4636cc1a5a321ff50436b80c5
master_replid2:0000000000000000000000000000000000000000
master_repl_offset:1981
second_repl_offset:-1
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:18
repl_backlog_histlen:1964
127.0.0.1:6380> get key1 #值还是可以获取
"123"
127.0.0.1:6380> get key2 #此时读一个还未向主机中写入的值
(nil)

主机重新上线，并写入一个值

[root@hecs-66133 bin]# redis-server selfconfig/redis79.conf
[root@hecs-66133 bin]# redis-cli
127.0.0.1:6379> set key2 456
OK

从机再次读，获取到值

127.0.0.1:6380> get key2
"456"

此处还未开启哨兵模式，真正的情况是一个主机下线后，从其余的从机中再次选举一个主机

如果使用的命令行配置的主从，如果重启了，就会变回主机，只要再次指定主机，立马就会从主机中获取值

主从复制原理

Slave 启动成功连接到 master 后会发送一个sync同步命令，Master 接到命令，启动后台的存盘进程，同时收集所有接收到的用于修改数据集命令，在后台进程执行完毕之后，master将传送整个数据文件到slave，并完成一次完全同步。
全量复制：而slave服务在接收到数据库文件数据后，将其存盘并加载到内存中
增量复制：Master 继续将新的所有收集到的修改命令依次传给slave，完成同步
但是只要是重新连接master，一次完全同步( 全量复制) 将被自动执行，数据一定可以在从机中看到 !

链路模型

上一个主节点连接下一个从节点

graph LR
M79-->SM80-->s81

中间的节点仍然为从节点

自举主节点

在没有哨兵模式时，一个主节点下线后，从节点可以自己选举自己为主节点

127.0.0.1:6380> SLAVEOF no one
OK
127.0.0.1:6380> info replication
# Replication
role:master #角色变换为主节点
connected_slaves:0
master_failover_state:no-failover
master_replid:798627c122eb1112b62d532e04cee6ce80c13611
master_replid2:9e35ba690be480d1feb8498c89eade0b958dc167
master_repl_offset:98353
second_repl_offset:98354
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:15
repl_backlog_histlen:98339

四、哨兵模式🥫

概述

主从切换技术的方法是：当主服务器宕机后，需要手动把一台从服务器切换为主服务器，这就需要人工干预，费事费力，还会造成一段时间内服务不可用。这不是一种推荐的方式，更多时候，我们优先考虑哨兵模式。

哨兵模式是通过将哨兵程序部署在一个独立的节点上，对 Redis 实例进行监控和管理。哨兵程序会周期性地向 Redis 实例发送心跳消息，确认 Redis 实例是否正常运行。如果 Redis 主服务器故障，哨兵程序会自动选举其中一台从服务器作为新的主服务器，同时通知其他哨兵和客户端更新主服务器信息，从而保持 Redis 服务的可用性。

首先Redis提供了哨兵的命令，哨兵是一个独立的进程，作为进程，它会独立运行。其原理是哨兵通过发送命令，等待Redis服务器响应，从而监控运行的多个Redis实例。

这里的哨兵有两个作用

通过发送命令，让Redis服务器返回监控其运行状态，包括主服务器和从服务器。
当哨兵监测到master宕机，会自动将slave切换成master，然后通过发布订阅模式通知其他的从服务器，修改配置文件，让它们切换主机。

然而一个哨兵进程对Redis服务器进行监控，可能会出现问题，为此，我们可以使用多个哨兵进行监控。各个哨兵之间还会进行监控，这样就形成了多哨兵模式。

假设主服务器宕机，哨兵1先检测到这个结果，系统并不会马上进行failover过程，仅仅是哨兵1主观的认为主服务器不可用，这个现象成为主观下线。当后面的哨兵也检测到主服务器不可用，并且数量达到一定值时，那么哨兵之间就会进行一次投票，投票的结果由一个哨兵发起，进行failover（故障转移）操作。切换成功后，就会通过发布订阅模式，让各个哨兵把自己监控的从服务器实现切换主机，这个过程称为客观下线。

测试

配置哨兵模式配置文件sentinel.conf

#sentinel monitor 被监控的名称 host  port
sentinel monitor myredis 127.0.0.1 6379 1

数字1代表当有多少个 sentinel 认为主服务器宕机时，它才算真正的宕机掉，通常数量为半数或半数以上数量设置。

启动哨兵

redis-sentinel selfconfig/sentinel.conf

如果Master节点断开，这个时候就会从从机中随机选取一个服务器出来（其中有一个投票算法）

主机下线，开始选举

主机79

127.0.0.1:6379> SHUTDOWN
not connected>

哨兵选举

主机81

127.0.0.1:6381> info replication
# Replication
role:master #已选举为主机
connected_slaves:1
slave0:ip=127.0.0.1,port=6380,state=online,offset=60664,lag=1
master_failover_state:no-failover
master_replid:63d8f44e25d469bfba14af80dbc549a5f4796c8d
master_replid2:b90695a968da21dd93e1d4e378ee505b9171c26d
master_repl_offset:60664
second_repl_offset:49316
repl_backlog_active:1
repl_backlog_size:1048576
repl_backlog_first_byte_offset:1
repl_backlog_histlen:60664

如果主机此时回来了，只能归并到新的主机下，当做从机，这就是哨兵模式的规则!

哨兵集群的优缺点

优点：

自动化：哨兵模式能够自动监测Redis节点的健康状况，并在必要时进行自动切换，不需要人工干预。

高可用性：当主节点出现故障时，哨兵模式可以快速切换到备份节点，从而保持服务的高可用性和持久性。

可扩展性：通过增加更多的哨兵节点，可以轻松地扩展Redis集群的容量和性能。

故障转移：哨兵模式可以在主节点发生故障时自动进行故障转移，将从节点提升为主节点，避免因主节点失效而导致整个系统的崩溃。

缺点：

延迟问题：由于哨兵需要进行频繁的状态检查和转移操作，可能会对系统带来一定的延迟。

复杂性增加：引入哨兵模式后，需要对集群进行额外的配置和管理，增加了系统的复杂性。

配置繁琐：哨兵模式的配置相对繁琐，需要对多个哨兵节点进行正确的配置和管理。

在线扩容困难：Redis的哨兵模式不支持在线扩容，当集群容量达到上限时，在线扩容会变得非常困难。

哨兵模式全部配置

# Example sentinel.conf
 
# 哨兵sentinel实例运行的端口 默认26379

port 26379
 
# 哨兵sentinel的工作目录

dir /tmp
 
# 哨兵sentinel监控的redis主节点的 ip port 
# master-name  可以自己命名的主节点名字 只能由字母A-z、数字0-9 、这三个字符".-_"组成。
# quorum 当这些quorum个数sentinel哨兵认为master主节点失联 那么这时 客观上认为主节点失联了
# sentinel monitor    

sentinel monitor mymaster 127.0.0.1 6379 2

# 当在Redis实例中开启了requirepass foobared 授权密码 这样所有连接Redis实例的客户端都要提供密码
# 设置哨兵sentinel 连接主从的密码 注意必须为主从设置一样的验证密码
# sentinel auth-pass  

sentinel auth-pass mymaster MySUPER--secret-0123passw0rd

# 指定多少毫秒之后 主节点没有应答哨兵sentinel 此时 哨兵主观上认为主节点下线 默认30秒
# sentinel down-after-milliseconds  

sentinel down-after-milliseconds mymaster 30000

# 这个配置项指定了在发生failover主备切换时最多可以有多少个slave同时对新的master进行 同步，
这个数字越小，完成failover所需的时间就越长，
但是如果这个数字越大，就意味着越 多的slave因为replication而不可用。
可以通过将这个值设为 1 来保证每次只有一个slave 处于不能处理命令请求的状态。
# sentinel parallel-syncs  

sentinel parallel-syncs mymaster 1

# 故障转移的超时时间 failover-timeout 可以用在以下这些方面： 
#1. 同一个sentinel对同一个master两次failover之间的间隔时间。
#2. 当一个slave从一个错误的master那里同步数据开始计算时间。直到slave被纠正为向正确的master那里同步数据时。
#3.当想要取消一个正在进行的failover所需要的时间。  
#4.当进行failover时，配置所有slaves指向新的master所需的最大时间。不过，即使过了这个超时，slaves依然会被正确配置为指向master，但是就不按parallel-syncs所配置的规则来了
# 默认三分钟
# sentinel failover-timeout  

sentinel failover-timeout mymaster 180000
 
# SCRIPTS EXECUTION
#配置当某一事件发生时所需要执行的脚本，可以通过脚本来通知管理员，例如当系统运行不正常时发邮件通知相关人员。
#对于脚本的运行结果有以下规则：
#若脚本执行后返回1，那么该脚本稍后将会被再次执行，重复次数目前默认为10
#若脚本执行后返回2，或者比2更高的一个返回值，脚本将不会重复执行。
#如果脚本在执行过程中由于收到系统中断信号被终止了，则同返回值为1时的行为相同。
#一个脚本的最大执行时间为60s，如果超过这个时间，脚本将会被一个SIGKILL信号终止，之后重新执行。
 
#通知型脚本:当sentinel有任何警告级别的事件发生时（比如说redis实例的主观失效和客观失效等等），将会去调用这个脚本，
#这时这个脚本应该通过邮件，SMS等方式去通知系统管理员关于系统不正常运行的信息。调用该脚本时，将传给脚本两个参数，
#一个是事件的类型，
#一个是事件的描述。
#如果sentinel.conf配置文件中配置了这个脚本路径，那么必须保证这个脚本存在于这个路径，并且是可执行的，否则sentinel无法正常启动成功。
#通知脚本
# sentinel notification-script  

sentinel notification-script mymaster /var/redis/notify.sh
 
# 客户端重新配置主节点参数脚本
# 当一个master由于failover而发生改变时，这个脚本将会被调用，通知相关的客户端关于master地址已经发生改变的信息。
# 以下参数将会在调用脚本时传给脚本:
#       
# 目前总是“failover”,
# 是“leader”或者“observer”中的一个。 
# 参数 from-ip, from-port, to-ip, to-port是用来和旧的master和新的master(即旧的slave)通信的
# 这个脚本应该是通用的，能被多次调用，不是针对性的。
# sentinel client-reconfig-script  

sentinel client-reconfig-script mymaster /var/redis/reconfig.sh

参考资料

狂神说JavaRedis最新超详细版教程通俗易懂_哔哩哔哩_bilibili

Redis哨兵模式_Tang World的博客-CSDN博客

Redis从入门到放弃（8）：哨兵模式 - 知乎 (zhihu.com)

redis哨兵机制--配置文件sentinel.conf详解 - heroinss - 博客园 (cnblogs.com)