Supervisión de las métricas de los recursos de Lightsail - Amazon Lightsail

Supervisión de las métricas de los recursos de Lightsail

Monitoree el rendimiento de las instancias, las bases de datos, las distribuciones, los balanceadores de carga, los servicios de contenedores y los buckets de Amazon Lightsail mediante la verificación y recopilación de los datos de las métricas. Establezca una línea de base a lo largo del tiempo, de modo que pueda configurar alarmas para detectar con mayor facilidad anomalías y problemas con el rendimiento de sus recursos.

Amazon Lightsail informa los datos de las métricas para instancias, bases de datos, distribuciones de red de entrega de contenido (CDN), balanceadores de carga, servicios de contenedores y buckets. Puede ver y supervisar estos datos en la consola de Lightsail. La monitorización es una parte importante del mantenimiento de la fiabilidad, la disponibilidad y el desempeño de sus recursos. Supervise y recopile datos de métricas de sus recursos con regularidad para que pueda depurar con mayor facilidad un error de múltiples puntos, si ocurre alguno.

Contenido

Monitoreo eficaz de sus recursos

Debe establecer una línea de base para el rendimiento normal de los recursos en su entorno. Mida el rendimiento en varias ocasiones y con diferentes condiciones de carga. A medida que supervisa los recursos, debe anotar y registrar un historial del rendimiento del recurso a lo largo del tiempo. Compare el rendimiento actual de sus recursos con los datos históricos recopilados. Esto le ayuda a identificar patrones de rendimiento normales y anomalías de rendimiento, y a idear métodos para abordarlos.

Por ejemplo, puede supervisar la utilización de la CPU, la utilización de la red y las comprobaciones de estado de las instancias. Si el desempeño no alcanza los valores del punto de referencia establecido, es posible que deba volver a configurar u optimizar la instancia para reducir la utilización de la CPU o reducir el tráfico de red. En caso de que la instancia continúe funcionando por encima de los umbrales de uso de la CPU, debería cambiarse a un plan más grande (por ejemplo, el plan de 7 USD al mes en lugar del plan de 5 USD al mes). Puede cambiar a un plan más grande creando una nueva instantánea de la instancia y, a continuación, creando una nueva instancia a partir de la instantánea con el plan más grande.

Después de establecer una línea de base, puede configurar alarmas en la consola de Lightsail para notificarle cuando los recursos crucen los umbrales especificados. Para obtener más información, consulte Notificaciones y Alarmas.

Conceptos y terminología de métricas

La siguiente terminología y conceptos le ayudan a comprender mejor el uso de métricas en Lightsail.

Métricas

Una métrica representa un conjunto de puntos de datos ordenados por tiempo. Una métrica es una variable que monitoriza, y los puntos de datos son los valores de esa variable a lo largo del tiempo. Las métricas se definen de forma única mediante un nombre. Por ejemplo, algunas métricas de instancia proporcionadas por Lightsail incluyen la utilización de CPU (CPUUtilization), el tráfico de red entrante (NetworkIn) y el tráfico de red saliente (NetworkOut). Para obtener más información acerca de todas las métricas de recursos disponibles en Lightsail, consulte Métricas disponibles en Lightsail.

Retención de métricas

Los puntos de datos con un periodo de 60 segundos (resolución de 1 minuto) están disponibles durante 15 días. Los puntos de datos con un periodo de 300 segundos (resolución de 5 minutos) están disponibles durante 63 días. Los puntos de datos con un periodo de 3600 segundos (resolución de 1 hora) están disponibles para 455 días (15 meses).

Los puntos de datos que están disponibles inicialmente con un periodo más corto se acumulan para ser almacenados a largo plazo. Por ejemplo, los puntos de datos con una granularidad de 1 minuto permanecen disponibles durante 15 días con una resolución de 1 minuto. Después de 15 días estos datos siguen estando disponibles, pero se acumulan y solo se pueden recuperar con una resolución de 5 minutos. Después de 63 días, los datos siguen acumulándose y están disponibles con una resolución de 1 hora. Si necesita disponer de las métricas durante más tiempo, puede usar la API de Lightsail, la AWS Command Line Interface (AWS CLI) y los SDK para recuperar los puntos de datos y llevarlos un estado sin conexión o a otro almacenamiento.

Para obtener más información, consulte GetInstanceMetricData, GetBucketMetricData, GetLoadBalancerMetricData, GetDistributionMetricData y GetRelationalDatabaseMetricData en la Referencia de la API de Lightsail.

Statistics

Las estadísticas métricas son el medio en el que los datos se agregan a lo largo de un periodo de tiempo. Las estadísticas de ejemplo incluyen Average, Sum, y Maximum. Por ejemplo, los datos de métrica de utilización de CPU de instancia se pueden promediar utilizando la estadística Average, las conexiones de base de datos se pueden agregar mediante la estadística Sum, el tiempo máximo de respuesta del balanceador de carga se puede recuperar mediante la estadística Maximum, etc.

Para obtener una lista de estadísticas de métricas disponibles, consulte estadísticas de GetInstanceMetricData, estadísticas de GetBucketMetricData, estadísticas de GetLoadBalancerMetricData, estadísticas de GetDistributionMetricData y estadísticas de GetRelationalDatabaseMetricData en la Referencia de la API de Lightsail.

Unidades

Cada estadística tiene una unidad de medida. Entre las unidades de ejemplo se incluyen Bytes, Seconds, Count y Percent. Para obtener la lista completa de las unidades, consulte unidades de GetInstanceMetricData, unidades de GetLoadBalancerMetricData, unidades de GetDistributionMetricData y unidades de GetRelationalDatabaseMetricData en la referencia de la API de Lightsail.

Periodos

Un periodo es el tiempo asociado a un punto de datos específico (la granularidad de los puntos de datos devueltos). Cada punto de datos representa una suma de los datos de métrica recopilados durante un periodo de tiempo especificado. Los periodos se definen en segundos y los valores válidos para el periodo son cualquier múltiplo de 60 segundos (1 minuto) y 300 segundos (5 minutos).

Cuando recupera puntos de datos mediante la API de Lightsail, puede especificar un periodo, una hora de inicio y una hora de finalización. Estos parámetros determinan la duración de tiempo total asociada al punto de datos. Lightsail notifica datos de métricas en incrementos de 1 minuto o 5 minutos; por lo tanto, debe especificar los periodos en múltiplos de 60 segundos y 300 segundos. Los valores que especifique para la hora de inicio y la hora de finalización determinan cuántos periodos devuelve Lightsail. Si prefiere estadísticas acumuladas en bloques de diez minutos, especifique un periodo de 600. Para estadísticas acumuladas en toda la hora, especifique un periodo de 3600, etc.

Los períodos también son importantes para las alarmas de Lightsail. Lightsail evalúa los puntos de datos para las alarmas cada 5 minutos y cada punto de datos para las alarmas representa un periodo de 5 minutos de datos agregados. Cuando se crea una alarma para monitorizar una métrica específica, le solicita a Lightsail que compare dicha estadística con el valor de umbral que ha especificado. Puede controlar ampliamente cómo lleva a cabo la comparación Lightsail. Puede especificar el periodo durante el cual se realiza la comparación y también especificar cuántos periodos de evaluación se utilizan para llegar a una conclusión. Para obtener más información, consulte Alarmas.

Alarmas

Una alarma vigila una sola métrica durante un periodo de tiempo especificado y le notifica cuando la métrica cruza un umbral especificado. La notificación puede ser un banner que se muestra en la consola de Lightsail, un correo electrónico enviado a una dirección de correo electrónico especificada y un mensaje de texto SMS enviado a un número de teléfono móvil especificado. Para obtener más información, consulte Alarmas.

Métricas disponibles en Lightsail

Métricas de la instancia

Las siguientes métricas de instancias únicas están disponibles. Para obtener más información, consulte Ver métricas de instancia en Amazon Lightsail.

  • Uso de la CPU (CPUUtilization): porcentaje de unidades de computación asignadas que están actualmente en uso en la instancia. Esta métrica identifica la potencia de procesamiento para ejecutar las aplicaciones en la instancia. Las herramientas del sistema operativo pueden mostrar un porcentaje menor que Lightsail cuando la instancia no tiene asignado un núcleo de procesador completo.

    Al ver los gráficos de métricas de utilización de CPU de las instancias en la consola de Lightsail, verá zonas sostenibles y con ráfagas. Para obtener más información acerca de lo que significan estas zonas, consulte Zonas sostenibles y con ráfagas de utilización de CPU.

  • Capacidad de ampliación en minutos (BurstCapacityTime) y porcentaje (BurstCapacityPercentage): los minutos de capacidad de ampliación representan la cantidad de tiempo disponible para que la instancia se amplíe al 100 % de uso de la CPU. El porcentaje de capacidad de ampliación es el porcentaje de rendimiento de la CPU disponible para su instancia. La instancia consume y acumula capacidad de ráfaga continuamente. Los minutos de capacidad de ampliación se consumen plenamente solo cuando la instancia funciona con una utilización de la CPU del 100 %. Para obtener más información acerca de la capacidad de ráfaga de la instancia, consulte el artículo sobre la Visualización de la capacidad de ráfaga de una instancia en Amazon Lightsail.

  • Tráfico de red entrante (NetworkIn): número de bytes que la instancia recibe en todas las interfaces de red. Esta métrica identifica el volumen de tráfico de red entrante de la instancia. El número registrado es el número de bytes recibidos durante el periodo. Dado que esta métrica se notifica en intervalos de 5 minutos, divida el número notificado por 300 para buscar bytes/segundo.

  • Tráfico de red saliente (NetworkOut): número de bytes que la instancia envía en todas las interfaces de red. Esta métrica identifica el volumen de tráfico de red saliente de la instancia. El número registrado es el número de bytes enviados durante el periodo. Dado que esta métrica se notifica en intervalos de 5 minutos, divida el número notificado por 300 para buscar bytes/segundo.

  • Errores de verificación de estado (StatusCheckFailed): indica si la instancia ha superado o no tanto la comprobación de su estado como la comprobación de estado del sistema. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • Errores de verificación del estado de la instancia (StatusCheckFailed_Instance): indica si la instancia ha superado o no la comprobación de su estado. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • Errores de verificación del estado de sistema (StatusCheckFailed_System): indica si la instancia ha superado o no la comprobación de estado del sistema. Esta métrica puede ser 0 (superada) o 1 (no superada). Esta métrica está disponible con una frecuencia de 1 minuto.

  • No hay solicitudes de metadatos de tokens (MetadataNoToken): el número de veces que se ha accedido correctamente al servicio de metadatos de instancia sin un token. Esta métrica determina si hay procesos que acceden a metadatos de instancia mediante el servicio de metadatos de instancia versión 1, el cual no usa un token. Si todas las solicitudes usan sesiones basadas en token, como por ejemplo el servicio de metadatos de instancia versión 2, el valor es 0. Para obtener más información, consulte Metadatos de instancia y datos de usuario en Amazon Lightsail.

Métricas de bases de datos

Las siguientes métricas de base de datos están disponibles. Para obtener más información, consulte Visualización de métricas de base de datos en Amazon Lightsail.

  • Uso de la CPU (CPUUtilization): porcentaje de uso de la CPU actualmente en uso en la base de datos.

  • Conexiones de base de datos (DatabaseConnections): número de conexiones a la base de datos en uso.

  • Profundidad de la cola del disco (DiskQueueDepth): número de E/S (solicitudes de lectura/escritura) pendientes a la espera de obtener acceso al disco.

  • Espacio de almacenamiento libre (FreeStorageSpace): cantidad de espacio de almacenamiento disponible.

  • Rendimiento de recepción de red (NetworkReceiveThroughput): tráfico de red de entrada (recepción) en la base de datos, incluido el tráfico de base de datos del cliente y el tráfico de AWS utilizado en la supervisión y la replicación.

  • Rendimiento de la transmisión de red (NetworkTransmitThroughput): tráfico de red de salida (transmisión) en la base de datos, incluido el tráfico de base de datos del cliente y el tráfico de AWS utilizado en la supervisión y la replicación.

Métricas de distribución

Están disponibles las siguientes métricas de distribución. Para obtener más información, consulte Visualización de métricas de distribución en Amazon Lightsail.

  • Solicitudes (Requests): la cantidad total de solicitudes de lector recibidas por la distribución para todos los métodos HTTP y para las solicitudes HTTP y HTTPS.

  • Bytes cargados (BytesUploaded): el número de bytes cargados en el origen por la distribución mediante solicitudes POST y PUT.

  • Bytes descargados (BytesDownloaded): el número de bytes descargados por los lectores para las solicitudes GET, HEAD y OPTIONS.

  • Tasa de errores total (TotalErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 4xx o 5xx.

  • Tasa de errores HTTP 4xx (4xxErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 4xx. En estos casos, el cliente o el lector del cliente pueden haber cometido un error. Por ejemplo, un código de estado de 404 (No encontrado) significa que el cliente solicitó un objeto que no se pudo encontrar.

  • Tasa de errores HTTP 5xx (5xxErrorRate): porcentaje de todas las solicitudes de lector para las cuales el código de estado HTTP de la respuesta fue 5xx. En estos casos, el servidor de origen no cumplió con la solicitud. Por ejemplo, un código de estado de 503 (Servicio no disponible) significa que el servidor de origen no está disponible en ese momento.

Métricas del equilibrador de carga

Las siguientes métricas del balanceador de carga están disponibles. Para obtener más información, consulte Visualización de métricas del balanceador de carga en Amazon Lightsail.

  • Recuento de hosts en buen estado (HealthyHostCount): cantidad de instancias de destino que se considera que están en buen estado.

  • Recuento de hosts en mal estado (UnhealthyHostCount): cantidad de instancias de destino que se considera que están en mal estado.

  • Equilibrador de carga HTTP 4XX (HTTPCode_LB_4XX_Count): cantidad de códigos de error del cliente HTTP 4XX que proceden del equilibrador de carga. Los errores del cliente se generan cuando las solicitudes no tienen el formato correcto o están incompletas. Estas solicitudes no fueron recibidas por la instancia de destino. Este número no incluye códigos de respuesta generados por las instancias de destino.

  • Equilibrador de carga HTTP 5XX (HTTPCode_LB_5XX_Count): cantidad de códigos de error del servidor HTTP 5XX que proceden del equilibrador de carga. Esto no incluye los códigos de respuesta generados por la instancia de destino. Esta métrica se registra si no hay ninguna instancia en buen estado asociada al balanceador de carga o si la tasa de solicitudes supera la capacidad de las instancias o del balanceador de carga.

  • Instancia HTTP 2XX (HTTPCode_Instance_2XX_Count): cantidad de códigos de respuesta HTTP 2XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 3XX (HTTPCode_Instance_3XX_Count): cantidad de códigos de respuesta HTTP 3XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 4XX (HTTPCode_Instance_4XX_Count): cantidad de códigos de respuesta HTTP 4XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Instancia HTTP 5XX (HTTPCode_Instance_5XX_Count): cantidad de códigos de respuesta HTTP 5XX generados por las instancias de destino. Este número no incluye los códigos de respuesta generados por el equilibrador de carga.

  • Tiempo de respuesta de instancia (InstanceResponseTime): tiempo transcurrido, en segundos, después de que la solicitud abandona el equilibrador de carga hasta que se recibe una respuesta de la instancia de destino.

  • Recuento de errores de negociación TLS del cliente (ClientTLSNegotiationErrorCount): cantidad de conexiones TLS iniciadas por el cliente que no establecieron una sesión con el equilibrador de carga debido a un error TLS generado por el equilibrador de carga. Las causas posibles incluyen una discrepancia de los cifrados o los protocolos.

  • Recuento de solicitudes (RequestCount): cantidad de solicitudes procesadas sobre IPv4. Este número solo incluye las solicitudes con una respuesta generadas por una instancia de destino del balanceador de carga.

  • Recuento de conexiones rechazadas (RejectedConnectionCount): cantidad de conexiones que se rechazaron debido a que el equilibrador de carga ha alcanzado su número máximo de conexiones.

Métricas del servicio de contenedores

Están disponibles las siguientes métricas del servicio de contenedores. Para obtener más información, consulte Visualización de métricas del servicio de contenedores.

  • Uso de la CPU (CPUUtilization): el porcentaje medio de unidades de computación que están actualmente en uso en todos los nodos del servicio de contenedores. Esta métrica identifica la capacidad de procesamiento necesaria para ejecutar contenedores en el servicio de contenedores.

  • Uso de la memoria (MemoryUtilization): el porcentaje medio de memoria que está actualmente en uso en todos los nodos del servicio de contenedores. Esta métrica identifica la memoria necesaria para ejecutar contenedores en el servicio de contenedores.

Métricas de bucket

Están disponibles las siguientes métricas de buckets. Para obtener más información, consulte Visualización de métricas de bucket en Amazon Lightsail.

  • Tamaño del bucket (BucketSizeBytes): la cantidad de datos almacenados en un bucket. Este valor se calcula sumando el tamaño de todos los objetos del bucket (tanto los objetos actuales como los no actuales), incluido el tamaño de todas las partes correspondientes a todas las cargas multiparte incompletas en el grupo.

  • Número de objetos (NumberOfObjects): la cantidad total de objetos almacenados en un bucket. Este valor se calcula contando todos los objetos en el bucket (objetos actuales y no actuales) y el número total de partes correspondientes a todas las cargas de multiparte incompletas en el bucket.

nota

Los datos de las métricas de bucket no se notifican cuando el bucket está vacío.