RabbitMQ如何保证消息可靠性?

2024年 5月 9日 47.2k 0

本篇文章不再介绍RabbitMQ具体实现原理,直接介绍如何保证消息的可靠性问题。所谓可靠性,指消息不重不漏。

文章导读

RabbitMQ如何保证消息可靠性?-1图片

生产者消费者模型

  生产者-消费者模型用于描述两类进程(生产者和消费者)之间的数据交互。可以被认为是独立的服务,生产者负责生成数据,消费者负责处理这些数据。在分布式系统中,队列在其中扮演了消息(数据)传递的功能。

RabbitMQ如何保证消息可靠性?-1图片

关于消息队列的作用,一般解读为:

解耦:生产者和消费者独立运作,无需知道对方的运行状态。

异步:并非实时,生产者不必关注消费端的消费情况。

削峰:限制流量,防止消费者过载。

消息丢失

  这其实不难理解,就像生活中下单-快递-签收的过程。这个过程和上边的生产者-消费者模型恰有异曲同工之妙。

RabbitMQ如何保证消息可靠性?-2图片

这个过程中,

  • 下单用户(生产者)
  • 快递小哥(队列)
  • 签收人(消费者)
  • 快件(消息)

如果包裹被粗略的认为是一条消息,那么快件在邮寄过程中丢失了,就是消息丢失。快件从发货到签收,我们不用去关心中间发生了什么。但是要是没收到货,那得给我个理由。

如何排查?

  就上边的快件丢失问题,怎么知道快递为何没有收到?很简单,一段一段的排查:

  • 商家是否有发货?
  • 快递公司是否揽收?
  • 查看快递小哥是否放入代收点
  • 相应的,如果生产环境中突然发现诸如:告警、服务宕机、数据流转异常等问题时,我们也会在链路上(A、B、C三处)逐一排查。

    产生原因及解决方案

    1、生产端可靠性投递

    为确保消息从生产端可靠地投递到RabbitMQ,我们需要考虑以下几个关键点:

    网络故障:消息可能在传输过程中因网络问题而丢失。

    RabbitMQ故障:如果RabbitMQ宕机,消息也可能丢失。

    RabbitMQ如何保证消息可靠性?-3图片

    对应解决方案:

    • 开启事务机制

    事务在RabbitMQ中可能会影响性能,因为它们需要在所有节点上同步状态。因此,RabbitMQ尽量避免使用事务。核心代码:

    private static void executeTransaction(Channel channel) throws IOException {
            boolean transactionSuccess = false;
            try {
                // 开启事务
                channel.txSelect(); 
    
                // 执行一系列消息操作,例如:channel.basicPublish(exchange, routingKey, message);
                // 提交事务
                channel.txCommit(); 
                transactionSuccess = true;
            } catch (ShutdownSignalException | IOException e) {
                // 回滚事务
                if (!transactionSuccess) {
                    channel.txRollback(); 
                }
                throw e;
            }
        }
    • 生产者确认机制

    发布者确认机制允许发布者知道消息是否已经被RabbitMQ成功接收:

    public static void sendPersistentMessage(String host, String queueName, String message) {
            try (Connection connection = new ConnectionFactory().setHost(host).newConnection();
                 Channel channel = connection.createChannel()) {
                // 启用发布者确认
                channel.confirmSelect(); 
    
               // 将消息设置为持久化
                AMQP.BasicProperties properties = new AMQP.BasicProperties.Builder()
                        .deliveryMode(2) 
                        .build();
                        
                // 添加确认监听器
                channel.addConfirmListener(new ConfirmListener() {
                    @Override
                    public void handleAck(long deliveryTag, boolean multiple) throws IOException {
                        System.out.println("消息已确认: " + deliveryTag);
                        // 消息正确到达Broker时的处理逻辑
                    }
    
                    @Override
                    public void handleNack(long deliveryTag, boolean multiple) throws IOException {
                        System.out.println("消息未确认: " + deliveryTag);
                        // 因为内部错误导致消息丢失时的处理逻辑
                    }
                });
    
                channel.basicPublish("", queueName, properties, message.getBytes());
    
                // 等待消息确认,或者超时
                boolean allConfirmed = channel.waitForConfirms();
                
                if (allConfirmed) {
                    //所有消息都已确认
                } else {
                    //超时或其它
                }
               
            } catch (IOException | TimeoutException | InterruptedException e) {
                e.printStackTrace();
            }
    }

    2、消息持久化

    在RabbitMQ中,消息的持久化它确保消息不仅存储在内存中,而且也安全地保存在磁盘上。这样,即使在RabbitMQ服务崩溃或重启的情况下,消息也不会丢失,可以从磁盘恢复。

    RabbitMQ如何保证消息可靠性?-4图片

    消息到达RabbitMQ后通过Exchange交换机,路由给queue队列,最后发送给消费端。

    RabbitMQ如何保证消息可靠性?-5图片

    从RabbitMQ设计上看,消息的持久化应该从以下方面入手:

    • Exchange持久化:
    // 设置 durable = true; 
    channel.exchangeDeclare(exchangeName, "direct", durable);
    • 消息持久化:
    // 设置 MessageProperties.PERSISTENT_TEXT_PLAIN
    channel.basicPublish(exchangeName, routingKey, MessageProperties.PERSISTENT_TEXT_PLAIN, message.getBytes());
    • Queue持久化:
    //设置 boolean durable = true;
    channel.queueDeclare(queueName, durable, exclusive, false, null);

    这样,如果RabbitMQ收到消息后挂了,重启后会自行从磁盘上恢复消息。

    3、消费者确认机制

    如果上述生产端、消息队列都正确投递,那么问题出现在消费端是否可以正确消费?

    RabbitMQ如何保证消息可靠性?-6图片

    消费者在成功处理了一条消息后通知RabbitMQ,这样RabbitMQ在收到确认后才会移除队列中的消息。

    默认情况下,以下3种原因导致消息丢失:

    1、 网络故障:消费端还没接收到消息之前,发生网络故障导致消息丢失;

    2、 未接收消息前服务宕机:消费端突然挂机未接收到消息,此时消息会丢失;

    3、 处理过程中服务宕机:消费端正确接收到消息,但在处理消息的过程中发生异常或宕机了,消息也会丢失。

    这是因为RabbitMQ的自动ack机制,即默认RabbitMQ在消息发出后,不管消费端是否接收到,是否处理完,就立即删除这条消息,导致消息丢失。

    RabbitMQ如何保证消息可靠性?-7图片

    应对方案:

    • 将自动ack机制改为手动ack机制。
    DeliverCallback deliverCallback = (consumerTag, delivery) -> {
        try {
            //接收消息,业务处理
            //设置手动确认
            channel.basicAck(delivery.getEnvelope().getDeliveryTag(), false);
        } catch (Exception e) {
            //发生异常时,可以选择重新发送消息或进行错误处理
            // 例如,可以选择负确认(nack),让消息重回队列
            // channel.basicNack(delivery.getEnvelope().getDeliveryTag(), false, true);
        }
    };
    //设置autoAck为false,表示关闭自动确认机制,改为手动确认
    channel.basicConsume(QUEUE_NAME, autoAck, deliverCallback, consumerTag -> {});

    4、消息补偿机制

    以上3种解决办法理论上可靠,但是系统的异常或者故障比较偶然,我们没法做到100%消息不丢失。因此需要介入补偿机制或者人工干预。这是我们的最后一道防线。

    如何做消息补偿呢?其实就是将消息入库,通过定时任务重新发送失败的消息。详细流程如下:

    RabbitMQ如何保证消息可靠性?-8图片

    • 生产端发送消息;
    • 确认失败,将消息保存到数据库中,并设置初始状态0;
    • 定时任务以一定频率扫描数据库中status=0 的消息(失败消息);
    • 重发消息,可多次;
    • 重发成功,更新数据库:status=1;
    • 超过固定次数重发仍然失败,人工干预。

    标注:

    超过最大失败次数后,对于无法被正常消费的消息可移入死信队列。

    • 可人工干预手动排查
    • 也可自动重试,需要实现一个消费者来从死信队列中获取消息,并根据业务逻辑来决定是否以及如何重新发送消息。这里涉及到消息去重、幂等性处理等。

    以上,我们知道了消息丢失问题如何处理?那么对于消息重复的问题,下面做个介绍。

    消息重复消费

    消息重复消费是指在消息队列中,同一条消息被不同的消费者多次消费处理。

    产生原因:

    • 网络问题:消费者处理完消息后,因网络问题导致确认信息未能成功发送回消息队列。
    • 服务中断:消费者在确认消息之前服务崩溃,消息队列未收到确认信号。
    • 确认机制:自动确认模式下,如果确认在消息处理完成前发生,消息可能会被重复消费

    对应解决方案:

    1. 幂等性设计

    设计消费者的消息处理逻辑时,要保证即使消息被多次消费,也不会对系统状态产生不良影响。幂等性可以通过以下方式实现:

    • 数据库唯一约束:使用数据库的主键约束或唯一索引防止插入重复记录。
    • 业务逻辑检查:在执行业务操作前,先检查是否已经处理过该消息。

    2. 消息去重策略

    使用唯一标识符(如订单号、massageID)来识别消息,并在消费者中实现去重逻辑:

    • 缓存检查:使用内存缓存(如Redis)存储已处理的消息ID。
    • 持久化存储:将消息ID与处理状态保存在数据库中,以便跨服务重启后仍然有效。

    3. 手动确认与重试机制

    通过手动确认消息,控制消息何时从队列中移除:

    • 手动确认:在消息成功处理后,显式调用channel.basicAck()方法确认消息。
    • 重试机制:如果消息处理失败,可以选择将消息重新入队(channel.basicReject(requeue=true))或丢弃(channel.basicReject(requeue=false))。

    代码演示:

    消费者端去重逻辑

    @RabbitListener(queues = "queueName", acknowledgeMode = "MANUAL")
    public void receiveMessage(Message message, Channel channel) throws IOException {
        String messageId = message.getMessageProperties().getMessageId();
        
        // 检查消息是否已消费
        if (messageAlreadyProcessed(messageId)) {
            // 消息已消费,确认消息并返回
            channel.basicAck(message.getMessageProperties().getDeliveryTag(), false);
            return;
        }
        
        // 处理消息
        try {
            processMessage(message);
            // 消息处理成功,持久化消息ID并确认消息
            persistMessageId(messageId);
            channel.basicAck(message.getMessageProperties().getDeliveryTag(), false);
        } catch (Exception e) {
            // 处理失败,可以选择重新入队或丢弃
            boolean requeue = shouldRequeue(message);
            channel.basicReject(message.getMessageProperties().getDeliveryTag(), requeue);
        }
    }

    生产者端发布确认

    void sendWithConfirm(AmqpTemplate amqpTemplate, Message message) throws IOException {
        ConfirmCallback confirmCallback = (correlationData, ack, cause) -> {
            if (!ack) {
                // 处理消息发送失败的逻辑
                // ...
            }
        };
        amqpTemplate.setConfirmCallback(confirmCallback);
        amqpTemplate.convertAndSend("exchangeName", "routingKey", message);
    }

    具体实现需要根据实际业务逻辑和RabbitMQ配置进行调整。

    总结

    以上介绍了RabbitMQ保证消息可靠性的问题、产生原因、解决方案等。不足之处,欢迎指正。

    相关文章

    JavaScript2024新功能:Object.groupBy、正则表达式v标志
    PHP trim 函数对多字节字符的使用和限制
    新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
    使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
    为React 19做准备:WordPress 6.6用户指南
    如何删除WordPress中的所有评论

    发布评论