Prácticas recomendadas de Amazon MQ para RabbitMQ - Amazon MQ

Prácticas recomendadas de Amazon MQ para RabbitMQ

Utilice esta sección como referencia para encontrar rápidamente recomendaciones que le permitan maximizar el rendimiento y minimizar los costos al usar agentes de RabbitMQ en Amazon MQ.

importante

Actualmente, Amazon MQ no admite flujos, ni utiliza el registro estructurado en JSON, presentado en RabbitMQ 3.9.x.

importante

Amazon MQ para RabbitMQ no admite el nombre de usuario «guest» y eliminará la cuenta de invitado predeterminada cuando cree un nuevo agente. Amazon MQ también eliminará periódicamente cualquier cuenta creada por el cliente con dicho nombre.

Activación de las actualizaciones automáticas de versiones secundarias

Uso de la última versión del agente, correcciones de errores y seguridad, así como mejoras de rendimiento. Puedes activar las actualizaciones automáticas de las versiones secundarias de Amazon MQ para gestionar las actualizaciones a la última versión del parche.

Uso de características obsoletas

Si utiliza la versión 3.13 para RabbitMQ en Amazon MQ, verá un banner en la interfaz de usuario de administración de RabbitMQ con el mensaje Deprecated features are being used.

Navigation bar with Overview tab selected, showing Totals section header.

Esto se debe a que RabbitMQ en Amazon MQ utiliza las siguientes características que ya no se ofrecen en RabbitMQ o que se configuran automáticamente para RabbitMQ en Amazon MQ:

  • Replicación de cola clásica

  • Calidad del servicio global

  • Colas transitorias no exclusivas

Se trata de un banner informativo para la versión 3.13 que no requiere ninguna acción. Su agente de Amazon MQ seguirá utilizando estas características.

Elección del tipo de instancia de agente correcto para obtener el mejor rendimiento

El rendimiento de los mensajes de un tipo de instancia de agente depende del caso de uso de su aplicación. Se recomienda usar tipos de instancias de agente más pequeños, como t3.micro, para probar el rendimiento de una aplicación. El uso de estas microinstancias antes de utilizar instancias más grandes en producción puede mejorar el rendimiento de las aplicaciones y ayudarle a mantener unos costes de desarrollo bajos. En los tipos de instancias m5.large y superiores, puede usar implementaciones de clústeres para obtener una alta disponibilidad y durabilidad de los mensajes. En cambio, los tipos de instancias de agente más grandes pueden controlar clientes y colas, rendimientos altos, mensajes en memoria y mensajes redundantes a nivel de producción. Para obtener más información sobre cómo elegir el tipo de instancia correcto, consulte Directrices de dimensionamiento.

Uso de múltiples canales

Para evitar la pérdida de conexiones, usa varios canales a través de una sola conexión. Las aplicaciones deben evitar una relación de conexión individual con el canal. Recomendamos utilizar una conexión por proceso y, a continuación, un canal por subproceso. Evite el uso excesivo de los canales para evitar fugas en ellos.

Habilitar colas perezosas

Si está trabajando con colas muy largas que procesan grandes volúmenes de mensajes, habilitar la función colas perezosas puede mejorar el rendimiento del agente.

El comportamiento predeterminado de RabbitMQ es almacenar los mensajes en memoria caché y moverlos al disco solo cuando el agente necesita más memoria disponible. Mover los mensajes de la memoria al disco lleva tiempo y detiene el procesamiento de los mensajes. Las colas perezosas pueden incrementar significativamente la aceleración del proceso de traspaso de mensajes al disco, lo que da como resultado un menor número de mensajes almacenados en la memoria caché.

Para habilitar las colas perezosas, puede configurar los argumentos queue.declare en el momento de la instrucción o configurar una política a través de la consola de administración de RabbitMQ. En el siguiente ejemplo, se muestra la declaración de una cola perezosa mediante la biblioteca de cliente Java de RabbitMQ.

Map<String, Object> args = new HashMap<String, Object>(); args.put("x-queue-mode", "lazy"); channel.queueDeclare("myqueue", false, false, false, args);

De forma predeterminada, todas las colas de Amazon MQ para RabbitMQ de la versión 3.12.13 y versiones posteriores se comportan como colas perezosas. Para actualizar a la versión más reciente de Amazon MQ para RabbitMQ, consulte Actualización de una versión del motor del agente de Amazon MQ.

nota

Habilitar colas perezosas puede aumentar las operaciones de E/S en el disco.

Uso de mensajes persistentes y colas duraderas

Los mensajes persistentes pueden ayudar a evitar la pérdida de datos en situaciones en las que un agente se bloquea o se reinicia. Los mensajes persistentes se escriben en el disco tan pronto como llegan. Sin embargo, a diferencia de las colas perezosas, los mensajes persistentes se almacenan tanto en la memoria caché como en el disco, a menos que el agente necesite más memoria. En los casos en que se necesita más memoria, los mensajes se eliminan de la memoria mediante el mecanismo del agente de RabbitMQ que administra el almacenamiento de mensajes en el disco, comúnmente conocido como capa de persistencia.

Para habilitar la persistencia de mensajes, puede declarar las colas como durable y establecer el modo de entrega de mensajes en persistent. En el siguiente ejemplo, se muestra el uso de la biblioteca de cliente Java de RabbitMQ para declarar una cola duradera. Al trabajar con el AMQP 0-9-1, puede marcar los mensajes como persistentes configurando el modo de entrega como «2».

boolean durable = true; channel.queueDeclare("my_queue", durable, false, false, null);

Una vez que haya configurado la cola como duradera, puede enviar un mensaje persistente a la cola estableciendo MessageProperties en PERSISTENT_TEXT_PLAIN, como se muestra en el siguiente ejemplo.

import com.rabbitmq.client.MessageProperties; channel.basicPublish("", "my_queue", MessageProperties.PERSISTENT_TEXT_PLAIN, message.getBytes());

Mantener las colas cortas

En las implementaciones de clúster, las colas con un gran número de mensajes pueden provocar una sobreutilización de recursos. Cuando un agente está sobreutilizado, el reinicio de un agente de Amazon MQ para RabbitMQ puede degradar aún más el rendimiento. Si se reinicia, los agentes sobreutilizados podrían dejar de responder en el estado REBOOT_IN_PROGRESS.

Durante los periodos de mantenimiento, Amazon MQ realiza todos los trabajos de mantenimiento de a un nodo por vez para garantizar que el agente permanezca operativo. Como resultado, es posible que las colas deban sincronizarse a medida que cada se vaya reanudando la operación de cada nodo. Durante la sincronización, los mensajes que deben replicarse en los espejos se cargan en la memoria del volumen correspondiente de Amazon Elastic Block Store (Amazon EBS) para procesarlos en lotes. El procesamiento de mensajes en lotes permite agilizar la sincronización de las colas.

Si las colas se mantienen cortas y los mensajes son pequeños, las colas se sincronizan correctamente y reanudan la operación según lo previsto. Sin embargo, si la cantidad de datos de un lote se acerca al límite de memoria del nodo, el nodo genera una alarma de memoria elevada y se pausa la sincronización de colas. Para confirmar el uso de memoria, puede comparar las métricas RabbitMemUsed y RabbitMqMemLimit de los nodos del agente en CloudWatch. La sincronización no se puede completar hasta que se consuman o eliminen los mensajes, o se reduzca el número de mensajes del lote.

Si la sincronización de colas está en pausa por una implementación de clúster, recomendamos consumir o eliminar mensajes para reducir el número de mensajes en las colas. Una vez que se reduzca la profundidad de la cola y se complete su sincronización, el estado del agente cambiará a RUNNING. Para resolver una sincronización de cola en pausa, también puede aplicar una política para reducir el tamaño del lote de sincronización de colas.

También puede definir políticas de eliminación automática y TTL para reducir de forma proactiva el uso de recursos y reducir al mínimo los NACK de los consumidores. Poner los mensajes en cola en el agente requiere un uso intensivo de la CPU, por lo que un número elevado de NACK puede afectar a su rendimiento.

Configuración de la confirmación del publicador y el acuse de recibo de la entrega al consumidor

Se denomina confirmación del publicador al proceso de confirmar que se ha enviado un mensaje al agente. Las confirmaciones del publicador permiten a la aplicación saber que los mensajes se han almacenado de forma fiable. También pueden ayudar a controlar el ritmo de los mensajes almacenados en el agente. Sin las confirmaciones del publicador, no es posible confirmar que un mensaje se haya procesado correctamente y puede que su agente descarte los mensajes que no pueda procesar.

Del mismo modo, cuando una aplicación cliente envía confirmación de entrega y consumo de mensajes de vuelta al agente, se conoce como acuse de recibo del consumidor. Tanto la confirmación como el acuse de recibo son esenciales para garantizar la seguridad de los datos cuando se trabaja con agentes de RabbitMQ.

El acuse de recibo de entrega del consumidor suele configurarse en la aplicación cliente. Cuando se trabaja con AMQP 0-9-1, el acuse de recibo se puede habilitar configurando el método basic.consume. Los clientes de AMQP 0-9-1 también pueden configurar las confirmaciones del publicador mediante el envío del método confirm.select.

Normalmente, el acuse de recibo de entrega se habilita en un canal. Por ejemplo, cuando se trabaja con la biblioteca de cliente Java de RabbitMQ, se puede utilizar Channel#basicAck para configurar un acuse de recibo positivo basic.ack, como se muestra en el siguiente ejemplo.

// this example assumes an existing channel instance boolean autoAck = false; channel.basicConsume(queueName, autoAck, "a-consumer-tag", new DefaultConsumer(channel) { @Override public void handleDelivery(String consumerTag, Envelope envelope, AMQP.BasicProperties properties, byte[] body) throws IOException { long deliveryTag = envelope.getDeliveryTag(); // positively acknowledge a single delivery, the message will // be discarded channel.basicAck(deliveryTag, false); } });
nota

Los mensajes sin confirmar se deben almacenar en la memoria caché. Para limitar el número de mensajes que un consumidor captura previamente, puede establecer el parámetro Pre-fetch (Captura previa) para una aplicación cliente.

Puede configurar consumer_timeout para detectar cuándo los consumidores no confirman las entregas. Si el consumidor no envía un acuse de recibo dentro del tiempo de espera, el canal se cerrará y recibirá un PRECONDITION_FAILED. Para diagnosticar el error, use la API UpdateConfiguration para aumentar el valor de consumer_timeout.

Configurar la captura previa

Puede utilizar el valor de captura previa de RabbitMQ para optimizar la forma en que los consumidores consumen los mensajes. RabbitMQ implementa el mecanismo de captura previa de canales que proporciona AMQP 0-9-1 mediante la aplicación del recuento de captura previa a los consumidores en lugar de a los canales. El valor de captura previa se utiliza para especificar cuántos mensajes se envían al consumidor en un momento dado. De forma predeterminada, RabbitMQ establece un tamaño de búfer ilimitado para las aplicaciones cliente.

Hay varios factores a tener en cuenta al establecer un recuento de captura previa para los consumidores de RabbitMQ. Primero, considere el entorno y la configuración de los consumidores. Debido a que los consumidores necesitan mantener todos los mensajes en la memoria mientras se procesan, un alto valor de captura previa puede tener un impacto negativo en el rendimiento de los consumidores y, en algunos casos, puede provocar el bloqueo de todos los consumidores juntos. Del mismo modo, el propio agente de RabbitMQ guarda todos los mensajes que envía en la memoria caché hasta que recibe el acuse de recibo del consumidor. Un alto valor de captura previa puede hacer que el servidor de RabbitMQ se quede sin memoria rápidamente si el reconocimiento automático no está configurado para los consumidores y si los consumidores tardan un tiempo relativamente largo en procesar mensajes.

Teniendo en cuenta las consideraciones anteriores, recomendamos establecer siempre un valor de captura previa para evitar situaciones en las que un agente de RabbitMQ o sus consumidores se queden sin memoria debido a un gran número de mensajes sin procesar o sin reconocer. Si necesita optimizar sus agentes para que procesen grandes volúmenes de mensajes, puede probarlos junto con los consumidores utilizando un intervalo de recuentos de captura previa para determinar el valor en el que la sobrecarga de red se vuelve en gran medida insignificante en comparación con el tiempo que tarda un consumidor en procesar mensajes.

nota
  • Si las aplicaciones cliente se han configurado para confirmar automáticamente la entrega de mensajes a los consumidores, no servirá de nada establecer un valor de captura previa.

  • Todos los mensajes que capturados previamente se eliminan de la cola.

En el siguiente ejemplo, se muestra cómo establecer un valor de captura previa de 10 para un solo consumidor utilizando la biblioteca de clientes Java de RabbitMQ.

ConnectionFactory factory = new ConnectionFactory(); Connection connection = factory.newConnection(); Channel channel = connection.createChannel(); channel.basicQos(10, false); QueueingConsumer consumer = new QueueingConsumer(channel); channel.basicConsume("my_queue", false, consumer);
nota

En la biblioteca de clientes Java de RabbitMQ, el valor predeterminado para el indicador global se establece en false, por lo que el ejemplo anterior se puede escribir simplemente como channel.basicQos(10).

Configuración de Celery

Python Celery envía muchos mensajes innecesarios que pueden dificultar la búsqueda y el procesamiento de la información útil. Para reducir el ruido y facilitar el procesamiento, ingrese el siguiente comando:

celery -A app_name worker --without-heartbeat --without-gossip --without-mingle

Recuperación automática de fallas de red

Se recomienda habilitar siempre la recuperación automática de red para evitar un tiempo de inactividad significativo en caso de falla de las conexiones del cliente con los nodos de RabbitMQ. La biblioteca de cliente Java de RabbitMQ admite la recuperación automática de red de forma predeterminada, a partir de la versión 4.0.0.

La recuperación automática de la conexión se activa si se produce una excepción no controlada en el bucle de E/S de la conexión, si se detecta un tiempo de espera de la operación de lectura de socket o si el servidor pierde un latido.

En caso de falla en la conexión inicial entre un cliente y un nodo de RabbitMQ, no se activará la recuperación automática. Recomendamos escribir el código de la aplicación para tener en cuenta los errores de conexión iniciales al volver a intentar la conexión. En el siguiente ejemplo, se muestran fallas al reintentar iniciar la red mediante la biblioteca de cliente Java de RabbitMQ.

ConnectionFactory factory = new ConnectionFactory(); // enable automatic recovery if using RabbitMQ Java client library prior to version 4.0.0. factory.setAutomaticRecoveryEnabled(true); // configure various connection settings try { Connection conn = factory.newConnection(); } catch (java.net.ConnectException e) { Thread.sleep(5000); // apply retry logic }
nota

Si una aplicación cierra una conexión con el método Connection.Close, la recuperación automática de red no se activará ni se disparará.

Active Classic Queue v2 para su agente de RabbitMQ

Le recomendamos que active Classic Queue v2 (CQv2) para las versiones 3.10 y 3.11 del motor del agente para mejorar el rendimiento. Por ejemplo, para:

  • Reducir el uso de memoria

  • Mejorar la entrega a los consumidores

  • Aumentar el rendimiento de las cargas de trabajo para que los consumidores estén a la altura de los productores

Todas las colas de Amazon MQ para RabbitMQ en la versión 3.12.13 o versiones posteriores utilizan CQv2 de forma predeterminada. Para actualizar a la versión más reciente de Amazon MQ para RabbitMQ, consulte Actualización de una versión del motor del agente de Amazon MQ.

Migración de CQv1 a CQv2

Para utilizar CQv2, primero debe habilitar la marca de característica classic_mirrored_queue_version. Para obtener más información sobre las marcas de características, consulte Cómo activar las marcas de características.

Para migrar de CQv1 a CQv2, debe crear una nueva política de colas o editar una política de colas existente con la definición clave de la política queue-version establecida en 2. Para obtener más información sobre la aplicación de políticas, consulte Aplicación de políticas a Amazon MQ para RabbitMQ. Para obtener más información sobre cómo activar CQv2 con una política de colas, consulte Classic Queues en la documentación de RabbitMQ.

Recomendamos seguir nuestras otras prácticas recomendadas de rendimiento antes de iniciar la migración.

Si utiliza una política de colas, al eliminar la política de colas, las colas de CQv2 volverán a CQv1. No recomendamos pasar las colas de CQv2 a CQv1 porque RabbitMQ convierte la representación en disco de la cola. Esto puede consumir mucha memoria y llevar mucho tiempo si las colas son muy profundas.