RabbitMQ 入门教程之一

大纲

前言

学习资源

版本说明

组件版本说明
RabbitMQ Server3.8.26
RabbitMQ Client5.10.0
Erlang24.2
Java11

MQ 概念介绍

什么是 MQ

MQ(Message Queue),从字面意思上看,本质是个队列,FIFO 先入先出,只不过队列中存放的内容是 Message 而已,并且还是一种跨进程的通信机制,用于上下游传递消息。在互联网架构中,MQ 是一种非常常见的上下游 “逻辑解耦 + 物理解耦” 的消息通信服务。使用了 MQ 之后,消息发送上游只需要依赖 MQ, 不用依赖其他服务。

为什么要用 MQ

MQ 的四大核心作用:

  • 解耦 - 允许独立地扩展或修改不同业务的处理过程,只要确保它们遵守同样的接口约束。
  • 缓冲 - 有助于控制和优化数据流经过系统的速度,解决生产消息和消费消息的处理速度不一致的情况。
  • 削峰 - 在访问量剧增的情况下,应用仍然需要继续发挥作用,但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准来投入资源并随时待命,这无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力,而不会因为突发的超负荷的请求而完全崩溃。
  • 异步通信 - 很多时候,用户不想也不需要立即处理消息。消息队列提供了异步处理机制,允许用户把一个消息放入队列,但并不立即处理它。想向队列中放入多少消息就放多少,然后在需要的时候再去处理它们。

流量削峰

举个例子,如果订单系统最多能处理一万次订单,这个处理能力应付正常时段的下单时绰绰有余,正常时段下单一秒后就能返回结果。但是在高峰期,如果有两万次下单操作系统是处理不了的,只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲,可以取消这个限制,把一秒内下的订单分散成一段时间来处理,这时有些用户可能在下单十几秒后才能收到下单成功的操作,但是比不能下单的体验要好。

应用解耦

以电商应用为例,应用中有订单系统、库存系统、物流系统、支付系统。用户创建订单后,如果耦合调用库存系统、物流系统、支付系统,任何一个子系统出了故障,都会造成下单操作异常。当转变成基于消息队列的方式后,系统间调用的问题会减少很多,比如物流系统因为发生故障,需要几分钟来修复。在这几分钟的时间里,物流系统要处理的数据被缓存在消息队列中,用户的下单操作可以正常完成。当物流系统恢复后,继续处理订单信息即可,用户感受不到物流系统的故障,提升系统的可用性。

异步通信

有些服务间调用是异步的,例如 A 调用 B,B 需要花费很长时间执行,但是 A 需要知道 B 什么时候可以执行完。以前一般有两种方式,A 过一段时间去调用 B 的查询 API。或者 A 提供一个 CallBack API,B 执行完之后调用 API 通知 A 服务。这两种方式都不是很优雅,使用消息总线,可以很方便解决这个问题,A 调用 B 服务后,只需要监听 B 处理完成的消息,当 B 处理完成后,会发送一条消息给 MQ,MQ 会将此消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 API, 也不用提供 CallBack API。同样 B 服务也不用做这些操作,A 服务还能及时的得到异步处理成功的消息。

MQ 有哪些产品

Kafka

大数据领域的杀手锏,谈到大数据领域内的消息传输,则绕不开 Kafka,这款为大数据而生的消息中间件,以其百万级 TPS 的吞吐量名声大噪,迅速成为大数据领域的宠儿,在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被 LinkedIn、Uber、Twitter、Netflix 等大公司所采用。

  • 优点:性能卓越,单机写入 TPS 约在百万条 / 秒,最大的优点就是吞吐量高。时效性 ms 级可用性非常高,Kafka 是分布式架构的,一个数据多个副本,少数机器宕机,不会丢失数据,不会导致不可用,消费者采用 Pull 方式获取消息,消息有序,通过控制能够保证所有消息被消费且仅被消费一次。Kafka 有优秀的第三方 Kafka Web 管理界面 Kafka-Manager,且在日志领域比较成熟,被多家公司和多个开源项目使用。Kafka 的功能较为简单,主要支持简单的 MQ 功能,在大数据领域的实时计算以及日志采集被大规模使用。

  • 缺点:Kafka 单机超过 64 个队列 / 分区,Load 会发生明显的飙高现象,队列越多,Load 越高,发送消息响应时间变长,使用短轮询方式,实时性取决于轮询间隔时间;支持消息顺序,但是一台代理宕机后,可能会产生消息乱序,社区更新较慢。

RabbitMQ

在 2007 年发布,是一个在 AMQP(高级消息队列协议)基础上完成的,可复用的企业消息系统,是当前最主流的消息中间件之一。

  • 优点:由于 Erlang 语言的高并发特性,RabbitMQ 性能较好,吞吐量达到万级。MQ 功能比较完备,健壮、稳定、易用、跨平台、支持多种语言,比如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP 等。开源提供的管理界面非常棒,用起来很好用,社区活跃度高,更新频率相当高。

  • 缺点:商业版需要收费,学习成本较高。集群管理难,搭建和维护多节点集群比其他消息队列复杂。

RocketMQ

RocketMQ 出自阿里巴巴的开源产品,用 Java 语言实现,在设计时参考了 Kafka,并做出了自己的一些改进。被阿里巴巴广泛应用在订单、交易、充值、流计算、消息推送、日志流式处理,binlog 分发等场景。

  • 优点:单机吞吐量十万级,可用性非常高,分布式架构,消息可以做到零丢失。MQ 功能较为完善,而且还是分布式架构的,扩展性好,支持 10 亿级别的消息堆积,不会因为消息堆积导致性能下降。源码是 Java 编写的,开发者可以自己阅读源码,定制自己公司的 MQ。

  • 缺点:支持的客户端语言不是很多,目前主要是支持 Java、Go、Python、C++、C#。社区活跃度一般,没有在 MQ 核心中去实现 JMS 等接口,有些系统要迁移需要修改大量代码。

ActiveMQ

  • 优点:单机吞吐量万级,时效性 ms 级,可用性高,基于主从架构实现高可用性,消息可靠性较低的概率丢失数据。
  • 缺点:官方社区现在对 ActiveMQ 5.x 维护越来越少,高吞吐量场景较少使用。

MQ 的选型建议

  • Kafka

    • Kafka 主要特点是基于 Pull 的模式来处理消息消费,追求高吞吐量,一开始的目的就是用于日志收集和传输,适合产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用,如果有日志采集功能,肯定是首选 Kafka 了。
  • RocketMQ

    • 天生为金融互联网领域而生,对于可靠性要求很高的场景,尤其是电商里面的订单扣款,以及业务削峰,在大量交易涌入时,后端可能无法及时处理的情况。RoketMQ 在稳定性上可能更值得信赖,这些业务场景在阿里双 11 已经经历了多次考验。如果业务有上述并发场景,建议可以选择 RocketMQ。
  • RabbitMQ

    • 结合 Erlang 语言本身的并发优势,性能较好,时效性微秒级,社区活跃度也比较高,管理界面用起来十分方便。如果数据量并不是很大,中小型公司优先选择功能比较完备的 RabbitMQ。

RabbitMQ 快速入门

RabbitMQ 是一个消息中间件,可以接受并转发消息。举个现实例子,可以把它当做一个快递站点,当你要发送一个包裹时,你把自己的包裹放到快递站,快递员最终会把你的快递送到收件人那里,按照这种逻辑 RabbitMQ 是一个快递站,一个快递员帮你传递快件。RabbitMQ 与快递站的主要区别在于,它不处理快件而是接收,并存储和转发消息数据。

四大核心概念

  • 生产者(Producer)

    • 产生数据发送消息的程序是生产者。
  • 交换机(Exchange)

    • 交换机是 RabbitMQ 非常重要的一个组件,一方面它接收来自生产者的消息,另一方面它将消息推送到队列中。
    • 交换机必须确切知道如何处理它接收到的消息,是将这些消息推送到特定队列还是推送到多个队列,亦或者是把消息丢弃,这个得由交换机的类型来决定。
  • 队列(Queue)

    • 队列是 RabbitMQ 内部使用的一种数据结构,尽管消息流经 RabbitMQ 和应用程序,但它们只能存储在队列中。
    • 队列仅受主机的内存和磁盘限制的约束,本质上是一个大的消息缓冲区。
    • 许多生产者可以将消息发送到一个队列,多个消费者可以尝试从一个队列接收数据,这就是最常见使用队列的方式。
  • 消费者(Consumer)

    • 消费与接收具有相似的含义,消费者大多时候是一个等待接收消息的程序。
    • 请注意生产者、消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。

七大工作模式

工作模式说明
简单模式只有一个生产者和一个消费者
工作队列模式一个生产者,多个消费者,同一条消息只会被一个消费者成功消费
发布 / 订阅模式一个生产者发送的消息会被多个消费者获取
路由模式发送消息到交换机,并且要指定路由 Key,消费者在将队列绑定到交换机时需要指定路由 Key
主题模式根据主题进行匹配,此时队列需要绑定在一个模式上,# 只匹配一个单词,* 匹配一个单词或者多个单词
RPC 模式使用 MQ 可以实现 RPC 的异步调用,基于 Direct 交换机实现
发布者确认模式 RabbitMQ 确保消息可靠投递的机制

简单模式

  • 这种模式只有一个生产者、一个队列、一个消费者,也被称为 “简单队列模式”。
  • 消息产生者将消息放入队列,消息的消费者监听消息队列,如果队列中有消息,就消费掉,消息被消费后,会自动从队列中删除。
  • 存在隐患,比如:消息可能没有被消费者正确处理,但在队列中已经被删除了,造成消息的丢失。
  • 应用场景:聊天(中间需要有一个过度的服务器 - P 端 与 C 端)。

工作队列模式

  • 这种模式(竞争资源 - 在工作进程之间分发任务)有一个生产者、一个队列、多个消费者,同一条消息只会被一个消费者成功消费。
  • 消息生产者将消息放入队列,消费者可以有多个。比如:消费者 1 与 消费者 2 同时监听同一个队列,消息被消费时,两个消费者共同争抢当前的消息队列内容,谁先抢到谁负责消费消息。
  • 存在隐患:高并发情况下,可能会发生某一个消息被多个消费者共同消费。
  • 应用场景:抢红包、大型项目中的资源调度(任务分配系统不需知道哪一个任务执行系统处于空闲状态,直接将任务放进到消息队列中,空闲的任务执行系统自动争抢任务)。

发布订阅模式

  • 这种模式(共享资源 - 将消息同时发送给多个消费者)有一个生产者、一个交换机、多个队列、多个消费者,也被称为 “交换机模式”。
  • 每个消费队列中的消息内容都一致,且每个消费者都会从自己的消息队列的第一个消息开始消费,直到最后一个消息。
  • 交换机是 RabbitMQ 中的内部组件。消息生产者将消息发送给 RabbitMQ 后,RabbitMQ 会根据订阅的消费者个数,自动生成对应数量的消息队列,这样每个消费者都能获取生产者发送的全部消息。
  • 实际上,前两种模式也使用了交换机,只是使用了采用默认设置的交换机。交换机参数是可以配置的,如果消息配置的交换机参数和 RabbitMQ 队列绑定(Binding)的交换机名称相同,则转发消息,否则丢弃消息。
  • 存在隐患:一旦消费者断开与 RabbitMQ 的连接,队列就会消失。如果消费者数目很多,对于 RabbitMQ 而言,也是个重大负担;因为发布 / 订阅模式是个长连接,占用并发数,且每个消费者分配一个队列会占用大量资源。
  • 应用场景:邮件群发、群聊、广播通信。

路由模式

  • 这种模式(选择性地接收消息)有一个生产者、一个交换机、多个队列、多个消息消费者,也被称为 “Routing 转发模式”。
  • 一个交换机绑定多个消息队列,每个消息队列都有自己唯一的 RouteKey,每一个消息队列都被一个消费者监听。
  • 消息生产者将消息发送给交换机,交换机按照路由的 Key 进行判断,将消息推送到与之绑定的队列。即交换机根据路由的 Key,匹配上路由 Key 对应的消息队列,最后由监听队列的消费者消费消息。

主题模式

  • 这种模式(基于 Topic 接收消息)有一个生产者、一个交换机、多个队列、多个消息消费者,也被称为 “主题转发模式” 或者 “模糊匹配队列模式”,本质上是路由模式的一种(只是在路由功能的基础上增加了模糊匹配)。
  • 一个交换机绑定多个消息队列,每个消息队列都有自己唯一的 RouteKey,每一个消息队列都被一个消费者监听。
  • 每个消息队列自己唯一的 Routekey 不是一个确定值,更像是正则表达式对应的匹配规则。
  • 消息生产者将消息发送给交换机,交换机根据 RouteKey 模糊匹配到对应的队列,由监听队列的消费者消费消息。
  • 路由模糊匹配的规则:
    • #* 都是代表通配符。
    • # 代表一个单词,* 代表一个单词或者多个单词。

RPC 模式

  • RPC 即客户端远程调用服务端的方法,使用 MQ 可以实现 RPC 的异步调用,基于 Direct 交换机实现。整体工作流程如下:
    • 1、客户端即是生产者也是消费者,向 RPC 请求队列发送 RPC 调用消息,同时监听 RPC 响应队列。
    • 2、服务端监听 RPC 请求队列的消息,收到消息后执行服务端的本地方法,得到方法返回的结果。
    • 3、服务端将 RPC 方法的执行结果发送到 RPC 响应队列。
    • 4、客户端监听 RPC 响应队列,接收到 RPC 调用结果。

发布者确认模式

  • 这种模式是 RabbitMQ 确保消息可靠投递的机制。
  • 生产者发送消息后,Broker 会异步返回 ACK(Basic.Ack)表示消息已被接收并处理(如持久化到磁盘),若因故障或无法路由导致失败则返回 Nack(Basic.Nack)。
  • 相比事务机制,该模式性能更高,适用于要求消息严格防丢失的场景,需要通过 channel.confirmSelect() 启用并监听确认结果,常配合消息持久化、重试等策略一起使用。

底层工作原理

  • Broker

    • 接收和分发消息的应用,RabbitMQ Server 就是 Broker。
  • Virtual Host

    • 出于多租户和安全因素设计的,将 AMQP 的基本组件划分到一个虚拟的分组中,类似于网络中的 NameSpace 概念。
    • 当多个不同的用户使用同一个 RabbitMQ Server 提供的服务时,可以划分出多个 vhost,每个用户可以在自己的 vhost 中创建交换机和队列等。
  • Connection

    • 消息生产者 / 消息消费者和 Broker 之间建立的 TCP 连接。
  • Channel

    • 如果每次访问 RabbitMQ 都建立一个 Connection,在消息量大的时候建立 TCP 连接的开销将是巨大的,效率也较低。
    • Channel 是在 Connection 内部建立的逻辑连接,如果应用程序支持多线程,通常每个线程会创建单独的 Channel 进行通讯。
    • AMQP Method 包含了 Channel ID,可以帮助客户端和 Broker 识别 Channel,所以多个 Channel 之间是完全隔离的。
    • Channel 作为轻量级的 Connection,可以极大减少操作系统建立 TCP 连接所需的开销。
  • Exchange

    • 交换机,消息到达 Broker 的第一站,根据消息分发规则,匹配查询表中的 RoutingKey,将消息分发到 Queue 中去。
    • 常用的交换机类型有:direct (point-to-point)topic (publish-subscribe)fanout (multicast)
  • Queue

    • 队列,消息最终被发送到这里等待消费者消费掉。
  • Binding

    • Exchange 和 Queue 之间的虚拟连接。
    • Binding 中可以包含 RoutingKey,Binding 信息被保存到 Exchange 中的查询表中,作为消息的分发依据。