Creación de una alarma basada en un origen de datos conectado - Amazon CloudWatch

Creación de una alarma basada en un origen de datos conectado

Puede crear alarmas que observen las métricas de orígenes de datos que no estén en CloudWatch. Para obtener más información acerca de la creación de conexiones con los otros orígenes de datos, consulte Consulta de métricas de otros orígenes de datos.

Cómo crear una alarma en las métricas de un origen de datos al que se haya conectado
  1. Abra la consola de CloudWatch en https://console.aws.amazon.com/cloudwatch/.

  2. En el panel de navegación, seleccione Métricas y, a continuación, Todas las métricas.

  3. Seleccione la pestaña Consulta de múltiples orígenes.

  4. En Origen de datos, seleccione el origen de datos que desee utilizar.

  5. El generador de consultas le solicita la información necesaria para que la consulta recupere las métricas que se usarán en la alarma. El flujo de trabajo es diferente para cada origen de datos y se adapta a cada origen de datos. Por ejemplo, para Amazon Managed Service para Prometheus y los orígenes de datos de Prometheus, aparece un cuadro del editor de consultas de PromQL con un asistente de consultas.

  6. Cuando haya terminado de crear la consulta, elija Consulta de gráficos.

  7. Si el gráfico de muestra tiene el aspecto esperado, elija Crear alarma.

  8. Aparecerá la página Especificar métrica y condiciones. Si la consulta que está usando produce más de una serie temporal, verá un mensaje de advertencia en la parte superior de la página. Si es así, seleccione una función para añadir las series temporales en la función de agregación.

  9. (Opcional) Añada una Etiqueta para la alarma.

  10. En Cuando nombre-de-la-métrica sea . . ., elija Mayor, Mayor/Igual, Menor/Igual o Menor. En que . . ., especifique un número para el valor del umbral.

  11. Elija Configuración adicional. Para Puntos de datos para alarma, especifique el número de periodos de evaluación (puntos de datos) que deben tener el estado ALARM para que se active la alarma. Si estos dos valores coinciden, creerá una alarma que pasará al estado ALARM si se infringen muchos periodos consecutivos.

    Para crear una alarma M de N, especifique un número menor para el primer valor que el especificado para el segundo valor. Para obtener más información, consulte Evaluación de una alarma.

  12. En Tratamiento de datos que faltan, elija cómo debe comportarse la alarma cuando falten algunos puntos de datos. Para obtener más información, consulte Configuración de la forma en la que las alarmas de CloudWatch tratan los datos que faltan.

  13. Elija Siguiente.

  14. En Notificación, especifique el tema de Amazon SNS al que desee enviar la notificación cuando la alarma tenga una transición al estado ALARM, OK o INSUFFICIENT_DATA.

    1. (Opcional) Para que la alarma envíe varias notificaciones para el mismo estado de alarma o para estados de alarma diferentes, elija Añadir notificación.

      nota

      Le recomendamos que configure la alarma para que tome medidas cuando pase al estado de datos insuficientes, además de cuando pase al estado de alarma. Esto se debe a que muchos problemas con la función de Lambda que se conecta al origen de datos pueden provocar que la alarma pase a datos insuficientes.

    2. (Opcional) Para que no envíe notificaciones de Amazon SNS, elija Eliminar.

  15. Para que la alarma realice acciones de escalado automático, EC2, Lambda o de Systems Manager, elija el botón correspondiente y seleccione el estado de la alarma y la acción que se debe realizar. Si elige una función de Lambda como acción de la alarma, debe especificar el nombre de la función o el ARN y, si lo desea, puede elegir una versión específica de la función.

    Las alarmas solo pueden realizar acciones de Systems Manager cuando entran en el estado ALARMA. Para obtener más información sobre las acciones de Systems Manager, consulte Configuración de CloudWatch para crear OpsItems a partir de alarmas y Creación de incidentes.

    nota

    Para crear una alarma que realice una acción de SSM Incident Manager, debe contar con determinados permisos. Para obtener más información, consulte Ejemplos de políticas basadas en identidades del Administrador de incidentes de AWS Systems Manager.

  16. Elija Siguiente.

  17. En Nombre y descripción, escriba el nombre y la descripción de la alarma y elija Siguiente. El nombre debe contener solo caracteres UTF-8 y no puede contener caracteres de control ASCII. La descripción puede incluir el formato Markdown, que solo se muestra en la pestaña Detalles de la alarma de la consola de CloudWatch. Markdown puede resultar útil para añadir enlaces a manuales u otros recursos internos.

    sugerencia

    El nombre de alarma solo debe contener caracteres UTF-8. No puede contener caracteres de control ASCII.

  18. En Obtener vista previa y crear, confirme que la información y las condiciones son las correctas y luego, elija Crear alarma.

Detalles sobre las alarmas de los orígenes de datos conectados

  • Cuando CloudWatch evalúa una alarma, lo hace cada minuto, incluso si el período de la alarma es superior a un minuto. Para que la alarma funcione, la función de Lambda debe poder devolver una lista de marcas temporales que comiencen en cualquier minuto, no solo en múltiplos de la duración del período. Estas marcas temporales deben estar espaciadas a una distancia de un período.

    Por lo tanto, si el origen de datos consultado por Lambda solo puede devolver marcas temporales que sean múltiplos de la longitud del período, la función debería “volver a muestrear” los datos obtenidos para que coincidan con las marcas temporales esperadas por la solicitud GetMetricData.

    Por ejemplo, una alarma con un período de cinco minutos se evalúa cada minuto mediante ventanas de cinco minutos que cambian un minuto cada vez. En este caso:

    • Para la evaluación de la alarma a las 12:15:00, CloudWatch espera puntos de datos con marcas de tiempo de 12:00:00, 12:05:00 y 12:10:00.

    • Luego, para la evaluación de la alarma a las 12:16:00, CloudWatch espera puntos de datos con marcas de tiempo de 12:01:00, 12:06:00 y 12:11:00.

  • Cuando CloudWatch evalúa una alarma, todos los puntos de datos devueltos por la función de Lambda que no se alineen con las marcas temporales esperadas se descartan y la alarma se evalúa utilizando los puntos de datos esperados restantes. Por ejemplo, cuando la alarma se evalúa a las 12:15:00, se esperan datos con marcas de tiempo de 12:00:00, 12:05:00 y 12:10:00. Si recibe datos con marcas de tiempo de 12:00:00, 12:05:00, 12:06:00 y 12:10:00, los datos 12:06:00 se descartan y CloudWatch evalúa la alarma utilizando las demás marcas de tiempo.

    Luego, para la siguiente evaluación a las 12:16:00, se esperan datos con marcas de tiempo de 12:01:00, 12:06:00 y 12:11:00. Si solo tiene los datos con marcas de tiempo iguales a 12:00:00, 12:05:00 y 12:10:00, todos estos puntos de datos se ignoran a las 12:16:00 y la alarma pasa al estado según el modo en que especificó la alarma para tratar los datos faltantes. Para obtener más información, consulte Evaluación de una alarma.

  • Le recomendamos que cree estas alarmas para tomar medidas cuando pasen al estado INSUFFICIENT_DATA, ya que varios casos de uso de fallas de la función de Lambda harán la transición de la alarma a INSUFFICIENT_DATA, independientemente de la forma en que la configure para tratar los datos faltantes.

  • Si la función de Lambda devuelve un error o devuelve datos parciales:

    • Si hay un problema de permisos al llamar a la función de Lambda, la alarma comienza a tener transiciones de datos faltantes según la forma en que especificó la alarma para tratar los datos faltantes cuando la creó.

    • Si la función de Lambda devuelve 'StatusCode' = 'PartialData', la evaluación de la alarma falla y la alarma pasa a INSUFFICIENT_DATA después de tres intentos. Esto tarda unos tres minutos.

    • Cualquier otro error que provenga de la función de Lambda hace que la alarma pase a INSUFFICIENT_DATA.

  • Si la métrica solicitada por la función de Lambda presenta algún retraso, por lo que siempre falta el último punto de datos, debe utilizar una solución alternativa. Puede crear una alarma M a partir de N o aumentar el período de evaluación de la alarma. Para obtener más información sobre alarmas M a partir de N, consulte Evaluación de una alarma.