Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Opciones alarmantes con CloudWatch
Realizar un análisis único y automatizado de las métricas importantes le ayuda a detectar y resolver los problemas antes de que afecten a sus cargas de trabajo. CloudWatch facilita la representación gráfica y la comparación de varias métricas mediante el uso de varias estadísticas durante un período de tiempo específico. Puede utilizarla CloudWatch para buscar en todas las métricas con los valores de dimensión necesarios para encontrar las métricas que necesita para su análisis.
Le recomendamos que comience su enfoque de captura de métricas incluyendo un conjunto inicial de métricas y dimensiones para utilizarlas como referencia para supervisar una carga de trabajo. Con el tiempo, la carga de trabajo va madurando y puedes añadir métricas y dimensiones adicionales que te ayuden a analizarla y respaldarla mejor. Sus aplicaciones o cargas de trabajo pueden utilizar varios AWS recursos y tener sus propias métricas personalizadas. Debe agrupar estos recursos en un espacio de nombres para que sea más fácil identificarlos.
También debes tener en cuenta cómo se correlacionan los datos de registro y supervisión para poder identificar rápidamente los datos de registro y supervisión pertinentes para diagnosticar problemas específicos. Puede utilizar el mapa de AWS X-Ray rastreo para correlacionar los rastreos, las métricas, los registros y las alarmas a fin de diagnosticar problemas. También deberías considerar la posibilidad de incluir dimensiones adicionales en las métricas e identificadores en los registros de tus cargas de trabajo para ayudarte a buscar e identificar rápidamente los problemas en todos los sistemas y servicios.
Uso de CloudWatch alarmas para monitorizar y emitir alarmas
Puede usar CloudWatch las alarmas para reducir la supervisión manual de sus cargas de trabajo o aplicaciones. Debe empezar por revisar las métricas que está recopilando para cada componente de la carga de trabajo y determinar los umbrales adecuados para cada métrica. Asegúrese de identificar a qué miembros del equipo se les debe notificar cuando se supere un umbral. Debes establecer grupos de distribución y dirigirte a ellos, en lugar de a miembros individuales del equipo.
CloudWatch las alarmas se pueden integrar con su solución de administración de servicios para crear automáticamente nuevos tickets y ejecutar flujos de trabajo operativos. Por ejemplo, AWS proporciona el conector de administración de AWS servicios para ServiceNowayudarle AWS Service Management Connectora configurar rápidamente las integraciones. Este enfoque es fundamental para garantizar que las alarmas emitidas se reconozcan y se ajusten a los flujos de trabajo de operaciones existentes, que tal vez ya estén definidos en estos productos.
También puede crear varias alarmas para la misma métrica que tengan diferentes umbrales y períodos de evaluación, lo que ayuda a establecer un proceso de escalamiento. Por ejemplo, si tienes una OrderQueueDepth
métrica que hace un seguimiento de los pedidos de los clientes, puedes definir un umbral inferior durante un breve período medio de un minuto para avisar a los miembros del equipo de la aplicación por correo electrónico o Slack. También puedes definir otra alarma para la misma métrica durante un período más largo de 15 minutos y con el mismo umbral, que envíe páginas, correos electrónicos y notifique al equipo de aplicaciones y al jefe del equipo de aplicaciones. Por último, puedes definir una tercera alarma para un umbral medio fijo durante un período de 30 minutos que notifique a la alta dirección y a todos los miembros del equipo que hayan recibido la notificación anterior. La creación de varias alarmas le ayuda a tomar diferentes medidas para diferentes condiciones. Puede empezar con un proceso de notificación sencillo y, a continuación, ajustarlo y mejorarlo según sea necesario.
Uso de la detección de CloudWatch anomalías para monitorear y emitir alarmas
Puede utilizar la detección de CloudWatch anomalías si no está seguro de los umbrales que debe aplicar a una métrica concreta o si desea que una alarma ajuste automáticamente los valores límite en función de los valores históricos observados. CloudWatch La detección de anomalías es especialmente útil para las métricas que pueden tener cambios de actividad regulares y predecibles, por ejemplo, si los pedidos de compra diarios que se entregan el mismo día aumentan antes de la hora límite. La detección de anomalías permite establecer umbrales que se ajustan automáticamente y puede ayudar a reducir las falsas alarmas. Puede habilitar la detección de anomalías para cada métrica y estadística, y configurarla para que se emita una alarma en función de valores CloudWatch atípicos.
Por ejemplo, puede habilitar la detección de anomalías para la CPUUtilization
métrica y la AVG
estadística en una instancia. EC2 A continuación, la detección de anomalías utiliza hasta 14 días de datos históricos para crear el modelo de aprendizaje automático (ML). Puede crear varias alarmas con diferentes bandas de detección de anomalías para establecer un proceso de escalado de alarmas, similar a crear varias alarmas estándar con diferentes umbrales.
Para obtener más información sobre esta sección, consulte Crear una CloudWatch alarma basada en la detección de anomalías en la documentación. CloudWatch
Alarmante en varias regiones y cuentas
Los propietarios de las aplicaciones y las cargas de trabajo deben crear alarmas a nivel de aplicación para las cargas de trabajo que abarquen varias regiones. Recomendamos crear alarmas independientes en cada cuenta y región en la que esté desplegada la carga de trabajo. Puede simplificar y automatizar este proceso utilizando plantillas independientes AWS CloudFormation StackSets de la cuenta y la región para implementar los recursos de las aplicaciones con las alarmas necesarias. templateYou puede configurar las acciones de alarma para que se dirijan a un tema común de Amazon Simple Notification Service (AmazonSNS), lo que significa que se utiliza la misma notificación o acción correctiva independientemente de la cuenta o la región.
En entornos con varias cuentas y regiones, le recomendamos que cree alarmas agregadas para sus cuentas y regiones a fin de supervisar los problemas relacionados con las cuentas y las regiones mediante el uso AWS CloudFormation
StackSets y la agregación de métricas, como el promedio de CPUUtilization
todas las instancias. EC2
También debería considerar la posibilidad de crear alarmas estándar para cada carga de trabajo que esté configurada para las CloudWatch métricas y los registros estándar que capture. Por ejemplo, puede crear una alarma independiente para cada EC2 instancia que supervise la métrica de CPU utilización y notifique al equipo central de operaciones cuando CPU la utilización media supere el 80% a diario. También puede crear una alarma estándar que monitorice una CPU utilización media diaria inferior al 10%. Estas alarmas ayudan al equipo central de operaciones a trabajar con propietarios de cargas de trabajo específicos para cambiar el tamaño de las EC2 instancias cuando sea necesario.
Automatizar la creación de alarmas con etiquetas de EC2 instancia
Crear un conjunto estándar de alarmas para sus EC2 instancias puede llevar mucho tiempo, ser incoherente y propenso a errores. Puede acelerar el proceso de creación de alarmas utilizando la amazon-cloudwatch-auto-alarms