RabbitMQ 入门教程之一

发表于 2021-05-28 阅读次数：5 评论数：0 本文字数： 6.3k 阅读时长 ≈ 6 分钟

大纲

前言

学习资源

版本说明

组件	版本	说明
RabbitMQ Server	`3.8.26`
RabbitMQ Client	`5.10.0`
Erlang	`24.2`
Java	`11`

MQ 概念介绍

什么是 MQ

MQ（Message Queue），从字面意思上看，本质是个队列，FIFO 先入先出，只不过队列中存放的内容是 Message 而已，并且还是一种跨进程的通信机制，用于上下游传递消息。在互联网架构中，MQ 是一种非常常见的上下游 “逻辑解耦 + 物理解耦” 的消息通信服务。使用了 MQ 之后，消息发送上游只需要依赖 MQ，不用依赖其他服务。

为什么要用 MQ

MQ 的四大核心作用：

解耦 - 允许独立地扩展或修改不同业务的处理过程，只要确保它们遵守同样的接口约束。
缓冲 - 有助于控制和优化数据流经过系统的速度，解决生产消息和消费消息的处理速度不一致的情况。
削峰 - 在访问量剧增的情况下，应用仍然需要继续发挥作用，但是这样的突发流量并不常见。如果为以能处理这类峰值访问为标准来投入资源并随时待命，这无疑是巨大的浪费。使用消息队列能够使关键组件顶住突发的访问压力，而不会因为突发的超负荷的请求而完全崩溃。
异步通信 - 很多时候，用户不想也不需要立即处理消息。消息队列提供了异步处理机制，允许用户把一个消息放入队列，但并不立即处理它。想向队列中放入多少消息就放多少，然后在需要的时候再去处理它们。

流量削峰

举个例子，如果订单系统最多能处理一万次订单，这个处理能力应付正常时段的下单时绰绰有余，正常时段下单一秒后就能返回结果。但是在高峰期，如果有两万次下单操作系统是处理不了的，只能限制订单超过一万后不允许用户下单。使用消息队列做缓冲，可以取消这个限制，把一秒内下的订单分散成一段时间来处理，这时有些用户可能在下单十几秒后才能收到下单成功的操作，但是比不能下单的体验要好。

应用解耦

以电商应用为例，应用中有订单系统、库存系统、物流系统、支付系统。用户创建订单后，如果耦合调用库存系统、物流系统、支付系统，任何一个子系统出了故障，都会造成下单操作异常。当转变成基于消息队列的方式后，系统间调用的问题会减少很多，比如物流系统因为发生故障，需要几分钟来修复。在这几分钟的时间里，物流系统要处理的数据被缓存在消息队列中，用户的下单操作可以正常完成。当物流系统恢复后，继续处理订单信息即可，用户感受不到物流系统的故障，提升系统的可用性。

异步通信

有些服务间调用是异步的，例如 A 调用 B，B 需要花费很长时间执行，但是 A 需要知道 B 什么时候可以执行完。以前一般有两种方式，A 过一段时间去调用 B 的查询 API。或者 A 提供一个 CallBack API，B 执行完之后调用 API 通知 A 服务。这两种方式都不是很优雅，使用消息总线，可以很方便解决这个问题，A 调用 B 服务后，只需要监听 B 处理完成的消息，当 B 处理完成后，会发送一条消息给 MQ，MQ 会将此消息转发给 A 服务。这样 A 服务既不用循环调用 B 的查询 API，也不用提供 CallBack API。同样 B 服务也不用做这些操作，A 服务还能及时的得到异步处理成功的消息。

MQ 有哪些产品

扩展阅读

《消息中间件产品对比介绍》

Kafka

大数据领域的杀手锏，谈到大数据领域内的消息传输，则绕不开 Kafka，这款为大数据而生的消息中间件，以其百万级 TPS 的吞吐量名声大噪，迅速成为大数据领域的宠儿，在数据采集、传输、存储的过程中发挥着举足轻重的作用。目前已经被 LinkedIn、Uber、Twitter、Netflix 等大公司所采用。

优点：性能卓越，单机写入 TPS 约在百万条 / 秒，最大的优点就是吞吐量高。时效性 ms 级可用性非常高，Kafka 是分布式架构的，一个数据多个副本，少数机器宕机，不会丢失数据，不会导致不可用，消费者采用 Pull 方式获取消息，消息有序，通过控制能够保证所有消息被消费且仅被消费一次。Kafka 有优秀的第三方 Kafka Web 管理界面 Kafka-Manager，且在日志领域比较成熟，被多家公司和多个开源项目使用。Kafka 的功能较为简单，主要支持简单的 MQ 功能，在大数据领域的实时计算以及日志采集被大规模使用。
缺点：Kafka 单机超过 64 个队列 / 分区，Load 会发生明显的飙高现象，队列越多，Load 越高，发送消息响应时间变长，使用短轮询方式，实时性取决于轮询间隔时间；支持消息顺序，但是一台代理宕机后，可能会产生消息乱序，社区更新较慢。

RabbitMQ

在 2007 年发布，是一个在 AMQP（高级消息队列协议）基础上完成的，可复用的企业消息系统，是当前最主流的消息中间件之一。

优点：由于 Erlang 语言的高并发特性，RabbitMQ 性能较好，吞吐量达到万级。MQ 功能比较完备，健壮、稳定、易用、跨平台、支持多种语言，比如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP 等。开源提供的管理界面非常棒，用起来很好用，社区活跃度高，更新频率相当高。
缺点：商业版需要收费，学习成本较高。集群管理难，搭建和维护多节点集群比其他消息队列复杂。

RocketMQ

RocketMQ 出自阿里巴巴的开源产品，用 Java 语言实现，在设计时参考了 Kafka，并做出了自己的一些改进。被阿里巴巴广泛应用在订单、交易、充值、流计算、消息推送、日志流式处理，binlog 分发等场景。

优点：单机吞吐量十万级，可用性非常高，分布式架构，消息可以做到零丢失。MQ 功能较为完善，而且还是分布式架构的，扩展性好，支持 10 亿级别的消息堆积，不会因为消息堆积导致性能下降。源码是 Java 编写的，开发者可以自己阅读源码，定制自己公司的 MQ。
缺点：支持的客户端语言不是很多，目前主要是支持 Java、Go、Python、C++、C#。社区活跃度一般，没有在 MQ 核心中去实现 JMS 等接口，有些系统要迁移需要修改大量代码。

ActiveMQ

优点：单机吞吐量万级，时效性 ms 级，可用性高，基于主从架构实现高可用性，消息可靠性较低的概率丢失数据。
缺点：官方社区现在对 ActiveMQ 5.x 维护越来越少，高吞吐量场景较少使用。

MQ 的选型建议

Kafka
- Kafka 主要特点是基于 Pull 的模式来处理消息消费，追求高吞吐量，一开始的目的就是用于日志收集和传输，适合产生大量数据的互联网服务的数据收集业务。大型公司建议可以选用，如果有日志采集功能，肯定是首选 Kafka 了。
RocketMQ
- 天生为金融互联网领域而生，对于可靠性要求很高的场景，尤其是电商里面的订单扣款，以及业务削峰，在大量交易涌入时，后端可能无法及时处理的情况。RoketMQ 在稳定性上可能更值得信赖，这些业务场景在阿里双 11 已经经历了多次考验。如果业务有上述并发场景，建议可以选择 RocketMQ。
RabbitMQ
- 结合 Erlang 语言本身的并发优势，性能较好，时效性微秒级，社区活跃度也比较高，管理界面用起来十分方便。如果数据量并不是很大，中小型公司优先选择功能比较完备的 RabbitMQ。

RabbitMQ 快速入门

RabbitMQ 是一个消息中间件，可以接受并转发消息。举个现实例子，可以把它当做一个快递站点，当你要发送一个包裹时，你把自己的包裹放到快递站，快递员最终会把你的快递送到收件人那里，按照这种逻辑 RabbitMQ 是一个快递站，一个快递员帮你传递快件。RabbitMQ 与快递站的主要区别在于，它不处理快件而是接收，并存储和转发消息数据。

四大核心概念

生产者（Producer）
- 产生数据发送消息的程序是生产者。
交换机（Exchange）
- 交换机是 RabbitMQ 非常重要的一个组件，一方面它接收来自生产者的消息，另一方面它将消息推送到队列中。
- 交换机必须确切知道如何处理它接收到的消息，是将这些消息推送到特定队列还是推送到多个队列，亦或者是把消息丢弃，这个得由交换机的类型来决定。
队列（Queue）
- 队列是 RabbitMQ 内部使用的一种数据结构，尽管消息流经 RabbitMQ 和应用程序，但它们只能存储在队列中。
- 队列仅受主机的内存和磁盘限制的约束，本质上是一个大的消息缓冲区。
- 许多生产者可以将消息发送到一个队列，多个消费者可以尝试从一个队列接收数据，这就是最常见使用队列的方式。
消费者（Consumer）
- 消费与接收具有相似的含义，消费者大多时候是一个等待接收消息的程序。
- 请注意生产者、消费者和消息中间件很多时候并不在同一机器上。同一个应用程序既可以是生产者又是可以是消费者。

七大工作模式

工作模式	说明
简单模式	只有一个生产者和一个消费者
工作队列模式	一个生产者，多个消费者，同一条消息只会被一个消费者成功消费
发布 / 订阅模式	一个生产者发送的消息会被多个消费者获取
路由模式	发送消息到交换机，并且要指定路由 Key，消费者在将队列绑定到交换机时需要指定路由 Key
主题模式	根据主题进行匹配，此时队列需要绑定在一个模式上，`#` 只匹配一个单词，`*` 匹配一个单词或者多个单词
RPC 模式	使用 MQ 可以实现 RPC 的异步调用，基于 Direct 交换机实现
发布者确认模式	RabbitMQ 确保消息可靠投递的机制

简单模式

这种模式只有一个生产者、一个队列、一个消费者，也被称为 “简单队列模式”。
消息产生者将消息放入队列，消息的消费者监听消息队列，如果队列中有消息，就消费掉，消息被消费后，会自动从队列中删除。
存在隐患，比如：消息可能没有被消费者正确处理，但在队列中已经被删除了，造成消息的丢失。
应用场景：聊天（中间需要有一个过度的服务器 - P 端与 C 端）。

工作队列模式

这种模式（竞争资源 - 在工作进程之间分发任务）有一个生产者、一个队列、多个消费者，同一条消息只会被一个消费者成功消费。
消息生产者将消息放入队列，消费者可以有多个。比如：消费者 1 与消费者 2 同时监听同一个队列，消息被消费时，两个消费者共同争抢当前的消息队列内容，谁先抢到谁负责消费消息。
存在隐患：高并发情况下，可能会发生某一个消息被多个消费者共同消费。
应用场景：抢红包、大型项目中的资源调度（任务分配系统不需知道哪一个任务执行系统处于空闲状态，直接将任务放进到消息队列中，空闲的任务执行系统自动争抢任务）。

发布订阅模式

这种模式（共享资源 - 将消息同时发送给多个消费者）有一个生产者、一个交换机、多个队列、多个消费者，也被称为 “交换机模式”。
每个消费队列中的消息内容都一致，且每个消费者都会从自己的消息队列的第一个消息开始消费，直到最后一个消息。
交换机是 RabbitMQ 中的内部组件。消息生产者将消息发送给 RabbitMQ 后，RabbitMQ 会根据订阅的消费者个数，自动生成对应数量的消息队列，这样每个消费者都能获取生产者发送的全部消息。
实际上，前两种模式也使用了交换机，只是使用了采用默认设置的交换机。交换机参数是可以配置的，如果消息配置的交换机参数和 RabbitMQ 队列绑定（Binding）的交换机名称相同，则转发消息，否则丢弃消息。
存在隐患：一旦消费者断开与 RabbitMQ 的连接，队列就会消失。如果消费者数目很多，对于 RabbitMQ 而言，也是个重大负担；因为发布 / 订阅模式是个长连接，占用并发数，且每个消费者分配一个队列会占用大量资源。
应用场景：邮件群发、群聊、广播通信。

路由模式

这种模式（选择性地接收消息）有一个生产者、一个交换机、多个队列、多个消息消费者，也被称为 “Routing 转发模式”。
一个交换机绑定多个消息队列，每个消息队列都有自己唯一的 RouteKey，每一个消息队列都被一个消费者监听。
消息生产者将消息发送给交换机，交换机按照路由的 Key 进行判断，将消息推送到与之绑定的队列。即交换机根据路由的 Key，匹配上路由 Key 对应的消息队列，最后由监听队列的消费者消费消息。

主题模式

这种模式（基于 Topic 接收消息）有一个生产者、一个交换机、多个队列、多个消息消费者，也被称为 “主题转发模式” 或者 “模糊匹配队列模式”，本质上是路由模式的一种（只是在路由功能的基础上增加了模糊匹配）。
一个交换机绑定多个消息队列，每个消息队列都有自己唯一的 RouteKey，每一个消息队列都被一个消费者监听。
每个消息队列自己唯一的 Routekey 不是一个确定值，更像是正则表达式对应的匹配规则。
消息生产者将消息发送给交换机，交换机根据 RouteKey 模糊匹配到对应的队列，由监听队列的消费者消费消息。
路由模糊匹配的规则：
- # 和 * 都是代表通配符。
- # 代表一个单词，* 代表一个单词或者多个单词。

RPC 模式

RPC 即客户端远程调用服务端的方法，使用 MQ 可以实现 RPC 的异步调用，基于 Direct 交换机实现。整体工作流程如下：
- 1、客户端即是生产者也是消费者，向 RPC 请求队列发送 RPC 调用消息，同时监听 RPC 响应队列。
- 2、服务端监听 RPC 请求队列的消息，收到消息后执行服务端的本地方法，得到方法返回的结果。
- 3、服务端将 RPC 方法的执行结果发送到 RPC 响应队列。
- 4、客户端监听 RPC 响应队列，接收到 RPC 调用结果。

发布者确认模式

这种模式是 RabbitMQ 确保消息可靠投递的机制。
生产者发送消息后，Broker 会异步返回 ACK（Basic.Ack）表示消息已被接收并处理（如持久化到磁盘），若因故障或无法路由导致失败则返回 Nack（Basic.Nack）。
相比事务机制，该模式性能更高，适用于要求消息严格防丢失的场景，需要通过 channel.confirmSelect() 启用并监听确认结果，常配合消息持久化、重试等策略一起使用。

底层工作原理

Broker
- 接收和分发消息的应用，RabbitMQ Server 就是 Broker。
Virtual Host
- 出于多租户和安全因素设计的，将 AMQP 的基本组件划分到一个虚拟的分组中，类似于网络中的 NameSpace 概念。
- 当多个不同的用户使用同一个 RabbitMQ Server 提供的服务时，可以划分出多个 vhost，每个用户可以在自己的 vhost 中创建交换机和队列等。
Connection
- 消息生产者 / 消息消费者和 Broker 之间建立的 TCP 连接。
Channel
- 如果每次访问 RabbitMQ 都建立一个 Connection，在消息量大的时候建立 TCP 连接的开销将是巨大的，效率也较低。
- Channel 是在 Connection 内部建立的逻辑连接，如果应用程序支持多线程，通常每个线程会创建单独的 Channel 进行通讯。
- AMQP Method 包含了 Channel ID，可以帮助客户端和 Broker 识别 Channel，所以多个 Channel 之间是完全隔离的。
- Channel 作为轻量级的 Connection，可以极大减少操作系统建立 TCP 连接所需的开销。
Exchange
- 交换机，消息到达 Broker 的第一站，根据消息分发规则，匹配查询表中的 RoutingKey，将消息分发到 Queue 中去。
- 常用的交换机类型有:direct (point-to-point)、topic (publish-subscribe)、fanout (multicast)。
Queue
- 队列，消息最终被发送到这里等待消费者消费掉。
Binding
- Exchange 和 Queue 之间的虚拟连接。
- Binding 中可以包含 RoutingKey，Binding 信息被保存到 Exchange 中的查询表中，作为消息的分发依据。

阅读全文

大纲

前言

学习资源

版本说明

MQ 概念介绍

什么是 MQ

为什么要用 MQ

流量削峰

应用解耦

异步通信

MQ 有哪些产品

Kafka

RabbitMQ

RocketMQ

ActiveMQ

MQ 的选型建议

RabbitMQ 快速入门

四大核心概念

七大工作模式

简单模式

工作队列模式

发布订阅模式

路由模式

主题模式

RPC 模式

发布者确认模式

底层工作原理

预览: