Surveillance efficace des ressources Concepts et terminologie des métriques Métriques disponibles dans Lightsail

Surveillez les indicateurs de vos ressources Lightsail

Surveillez les performances de vos instances, de vos bases de données, de vos distributions, de vos équilibreurs de charge, de vos services de conteneur et de vos compartiments dans Amazon Lightsail en vérifiant et en collectant leurs données métriques. Établissez une base de référence au fil du temps afin de pouvoir configurer des alarmes pour détecter plus facilement les anomalies et les problèmes liés aux performances de vos ressources.

Amazon Lightsail fournit des données métriques pour les instances, les bases de données, les distributions de réseaux de diffusion de contenu (CDN), les équilibreurs de charge, les services de conteneur et les compartiments. Vous pouvez consulter et surveiller ces données dans la console Lightsail. La surveillance est un enjeu important pour assurer la fiabilité, la disponibilité et les performances de vos ressources. Surveillez et collectez régulièrement les données de métriques de vos ressources pour être prêt à intervenir pour déboguer une éventuelle défaillance à plusieurs points.

Table des matières

Surveillance efficace des ressources
Concepts et terminologie des métriques
Métriques disponibles dans Lightsail

Surveillance efficace des ressources

Vous devez établir une base de référence des performances normales des ressources dans votre environnement. Mesurez les performances à différents moments et sous diverses conditions de charge. Lorsque vous surveillez vos ressources, vous devez noter et enregistrer un historique des performances de vos ressources au fil du temps. Comparez les performances actuelles de vos ressources aux données d'historique que vous avez collectées. Cela vous aide à identifier les modèles de performances normaux et les anomalies de performances, et à élaborer des méthodes pour résoudre ces anomalies.

Par exemple, vous pouvez surveiller l'utilisation de l'UC, l'utilisation du réseau et les vérifications d'état de vos instances. Lorsque les performances s'écartent de votre base de référence, vous pouvez être amené à reconfigurer ou à optimiser l'instance pour réduire l'utilisation de l'UC ou réduire le trafic réseau. Si votre instance continue de fonctionner au-dessus de vos seuils d'utilisation du processeur, vous souhaiterez peut-être passer à un plan plus important pour votre instance (utilisez le plan à 7 dollars américains par mois au lieu du plan à 5 dollars américains par mois). Vous pouvez adopter un plus grand plan en créant un nouvel instantané de votre instance, puis en créant une nouvelle instance à partir de cet instantané dans le cadre du plus grand plan.

Après avoir établi une base de référence, vous pouvez configurer des alarmes dans la console Lightsail pour vous avertir lorsque vos ressources dépassent les seuils spécifiés. Pour plus d'informations, veuillez consulter Notifications et Alarmes.

Concepts et terminologie des métriques

La terminologie et les concepts suivants vous aident à mieux comprendre l'utilisation des métriques dans Lightsail.

Métriques

Une métrique représente un ensemble de points de données ordonnés dans le temps. Envisagez une métrique comme une variable que vous surveillez, et les points de données comme les valeurs de cette variable au fil du temps. Les métriques sont identifiées de manière unique par un nom. Par exemple, certaines métriques d'instance fournies par Lightsail incluent l'utilisation du processeur CPUUtilization (), le trafic réseau entrant NetworkIn () et le trafic réseau sortant (). NetworkOut Pour plus d'informations sur toutes les mesures de ressources disponibles dans Lightsail, consultez la section Mesures disponibles dans Lightsail.

Conservation des métriques

Les points de données d'une période de 60 secondes (résolution de 1 minute) sont disponibles pendant 15 jours. Les points de données d'une période de 300 secondes (résolution de 5 minutes) sont disponibles pendant 63 jours. Les points de données d'une période de 3 600 secondes (résolution de 1 heure) sont disponibles pendant 455 jours (15 mois)

Les points de données qui sont initialement disponibles pour une plus courte période sont regroupés pour un stockage à long terme. Par exemple, les points de données avec une granularité de 1 minute restent disponibles pendant 15 jours avec une résolution de 1 minute. Après 15 jours, ces données restent disponibles mais elles sont regroupées et récupérables uniquement avec une résolution de 5 minutes. Après 63 jours, ces données sont de nouveau regroupées et disponibles avec une résolution d'1 heure. Si vous avez besoin de disposer de métriques au-delà de ces périodes, vous pouvez utiliser l'API AWS Command Line Interface Lightsail AWS CLI() et les SDK pour récupérer les points de données pour un stockage hors ligne ou différent.

Pour plus d'informations, consultez GetInstanceMetricData,, GetBucketMetricData GetLoadBalancerMetricData GetDistributionMetricData, et GetRelationalDatabaseMetricDatadans la référence de l'API Lightsail.

Statistiques

Les statistiques de métrique sont les moyens par lesquels les données sont agrégées sur une période donnée. Exemples de statistiques : Average, Sum et Maximum. Par exemple, les données de la métrique d'utilisation de l'UC d'une instance peuvent être moyennées à l'aide de la statistique Average. Les connexions à la base de données peuvent être ajoutées à l'aide de la statistique Sum. Le temps de réponse maximal de l'équilibreur de charge peut être récupéré à l'aide de la statistique Maximum, etc.

Pour obtenir la liste des statistiques métriques disponibles, voir statistiques pour GetInstanceMetricData, statistiques pour GetBucketMetricData, statistiques pour GetLoadBalancerMetricData et statistiques pour GetDistributionMetricData GetRelationalDatabaseMetricData dans la référence de l'API Lightsail.

Unités

Chaque statistique est associée à une unité de mesure. Il peut s'agir, par exemple, des unités Bytes, Seconds, Count ou Percent. Pour la liste complète des unités, voir unités pour GetInstanceMetricData, unités pour GetLoadBalancerMetricData et unités pour GetDistributionMetricData GetRelationalDatabaseMetricData dans la référence de l'API Lightsail.

Périodes

Une période correspond à la durée associée à un point de données spécifique, c'est-à-dire à la granularité des points de données renvoyés. Chaque point de données représente une agrégation des données de métrique collectées pendant une période spécifiée. Les périodes sont définies en secondes, et les valeurs valides de période sont tous les multiples de 60 secondes (1 minute) et de 300 secondes (5 minutes).

Lorsque vous récupérez des points de données à l'aide de l'API Lightsail, vous pouvez spécifier une période, une heure de début et une heure de fin. Ces paramètres déterminent la durée totale associée au point de données. Lightsail rapporte les données métriques par incréments de 1 minute ou de 5 minutes ; vous devez donc spécifier des périodes en multiples de 60 secondes et 300 secondes. Les valeurs que vous spécifiez pour l'heure de début et l'heure de fin déterminent le nombre de périodes renvoyées par Lightsail. Si vous préférez obtenir des statistiques regroupées en blocs de 10 minutes, spécifiez une période égale à 600. Pour des statistiques agrégées sur l'heure entière, spécifiez une période de 3 600, etc.

Les périodes sont également importantes pour les alarmes Lightsail. Lightsail évalue les points de données pour les alarmes toutes les 5 minutes, et chaque point de données pour les alarmes représente une période de 5 minutes de données agrégées. Lorsque vous créez une alarme pour surveiller une métrique spécifique, vous demandez à Lightsail de comparer cette métrique à la valeur de seuil que vous spécifiez. Vous avez un contrôle étendu sur la manière dont Lightsail effectue cette comparaison. Vous pouvez spécifier la période pendant laquelle la comparaison est effectuée, ainsi que le nombre de périodes d'évaluation utilisées pour parvenir à une conclusion. Pour plus d'informations, consultez Alarmes .

Alertes

Une alarme surveille une métrique unique sur une période de temps spécifiée et vous avertit lorsque cette métrique franchit un seuil que vous avez spécifié. La notification peut prendre la forme d'une bannière affichée dans la console Lightsail, d'un e-mail envoyé à une adresse e-mail que vous avez spécifiée ou d'un SMS envoyé à un numéro de téléphone mobile que vous avez indiqué. Pour plus d'informations, consultez Alarmes .

Métriques disponibles dans Lightsail

Métriques des instances

Les métriques d'instance ci-dessous sont disponibles. Pour plus d'informations, consultez la section Affichage des métriques d'instance dans Amazon Lightsail.

Utilisation du processeur (CPUUtilization) : pourcentage d'unités de calcul allouées qui sont actuellement en cours d'utilisation sur l'instance. Cette métrique identifie la puissance de traitement utilisée pour exécuter les applications sur l'instance. Les outils de votre système d'exploitation peuvent afficher un pourcentage inférieur à celui de Lightsail lorsque l'instance ne dispose pas d'un cœur de processeur complet.

Lorsque vous consultez les graphiques des métriques d'utilisation du processeur pour vos instances dans la console Lightsail, vous verrez des zones durables et éclatables. Pour de plus amples informations sur la signification de ces zones, veuillez consulter Zones durables et extensibles d'utilisation de l'UC.
Minutes de capacité de débordement (BurstCapacityTime) et pourcentage (BurstCapacityPercentage) : les minutes de capacité de débordement représentent le temps disponible pour que votre instance transmette des données en mode rafale à 100 % du processeur. Le pourcentage de capacité de débordement de l'UC représente le pourcentage de performances de l'UC disponible pour votre instance. Votre instance consomme et accumule en continu de la capacité en mode rafale. Les minutes de capacité de débordement ne sont consommées à plein débit que lorsque votre instance fonctionne en utilisant 100 % du processeur. Pour plus d'informations sur la capacité de rafale des instances, consultez la section Affichage de la capacité de rafale des instances dans Amazon Lightsail.
Trafic réseau entrant (NetworkIn) : nombre d'octets reçus par l'instance sur toutes les interfaces réseau. Cette métrique identifie le volume du trafic réseau entrant sur l'instance. Le nombre mentionné correspond au nombre d’octets reçus pendant la période. Comme cette métrique est signalée par intervalles de 5 minutes, divisez le nombre signalé par 300 pour obtenir des octets/s.
Trafic réseau sortant (NetworkOut) : nombre d'octets envoyés par l'instance sur toutes les interfaces réseau. Cette métrique identifie le volume du trafic réseau sortant de l'instance. Le nombre mentionné correspond au nombre d’octets envoyés pendant la période. Comme cette métrique est signalée par intervalles de 5 minutes, divisez le nombre signalé par 300 pour obtenir des octets/s.
Échecs de contrôle de statut (StatusCheckFailed) : indique si l'instance a réussi ou échoué à la fois au contrôle de statut de l'instance et au contrôle de statut du système. Cette métrique peut avoir la valeur 0 (succès) ou 1 (échec). Cette métrique est disponible à une fréquence de 1 minute.
Échecs de contrôle de statut d'instance (StatusCheckFailed_Instance) : indique si l'instance a réussi ou échoué au contrôle de statut d'instance. Cette métrique peut avoir la valeur 0 (succès) ou 1 (échec). Cette métrique est disponible à une fréquence de 1 minute.
Échecs de contrôle de statut du système (StatusCheckFailed_System) : indique si l'instance a réussi ou échoué au contrôle de statut du système. Cette métrique peut avoir la valeur 0 (succès) ou 1 (échec). Cette métrique est disponible à une fréquence de 1 minute.
Demande de métadonnées sans jeton (MetadataNoToken) : nombre d'accès réussis au service de métadonnées d'instance sans jeton. Cette métrique détermine s'il existe des processus accédant aux métadonnées d'instance qui utilisent Instance Metadata Service Version 1, et qui n'utilisent pas de jeton. Si toutes les demandes utilisent des sessions basées sur un jeton, par ex., Instance Metadata Service Version 2, la valeur est 0. Pour plus d'informations, consultez la section Métadonnées de l'instance et données utilisateur dans Amazon Lightsail.

Métriques de base de données

Les métriques de base de données ci-dessous sont disponibles. Pour plus d'informations, consultez la section Affichage des métriques de base de données dans Amazon Lightsail.

Utilisation du processeur (CPUUtilization) : pourcentage d'utilisation du processeur actuellement en cours d'utilisation sur la base de données.
Connexions de base de données (DatabaseConnections) : nombre de connexions de base de données en cours d'utilisation.
Profondeur de file d'attente de disque (DiskQueueDepth) : nombre de demandes d'E/S (lecture et écriture) qui attendent l'accès au disque.
Espace de stockage libre (FreeStorageSpace) : quantité d'espace de stockage disponible.
Débit de réception réseau (NetworkReceiveThroughput) : trafic réseau entrant (réception) sur la base de données, y compris le trafic de base de données client et le trafic AWS utilisé pour la surveillance et la réplication.
Débit de transmission réseau (NetworkTransmitThroughput) : trafic réseau sortant (transmission) sur la base de données, y compris le trafic de base de données client et le trafic AWS utilisé pour la surveillance et la réplication.

Métriques de distribution

Les métriques de distribution suivantes sont disponibles. Pour plus d'informations, consultez la section Affichage des statistiques de distribution dans Amazon Lightsail.

Requêtes (Requests) : nombre total de requêtes d'utilisateurs reçues par votre distribution, pour toutes les méthodes HTTP et pour les requêtes HTTP et HTTPS.
Octets chargés (BytesUploaded) : nombre d'octets chargés vers votre origine par votre distribution à l'aide des requêtes POST et PUT.
Octets téléchargés (BytesDownloaded) : nombre d'octets téléchargés par les utilisateurs pour les demandes GET, HEAD et OPTIONS.
Taux d'erreur total (TotalErrorRate) : pourcentage de toutes les demandes d'utilisateurs pour lesquelles le code d'état HTTP de la réponse était 4xx ou 5xx.
Taux d'erreurs HTTP 4xx (4xxErrorRate) : pourcentage de toutes les requêtes d'utilisateurs pour lesquelles le code d'état HTTP de la réponse était 4xx. Dans ces cas, le client ou l'utilisateur du client peut avoir fait une erreur. Par exemple, un code d'état 404 (Non trouvé) signifie que le client a demandé un objet qui est introuvable.
Taux d'erreurs HTTP 5xx (5xxErrorRate) : pourcentage de toutes les requêtes d'utilisateurs pour lesquelles le code d'état HTTP de la réponse était 5xx. Dans ces cas, le serveur d'origine n'a pas satisfait la demande. Par exemple, un code d'état 503 (Service non disponible) signifie que le serveur d'origine n'est pas disponible actuellement.

Métriques d'équilibreur de charge

Les métriques d'équilibreur de charge ci-dessous sont disponibles. Pour plus d'informations, consultez la section Affichage des métriques de l'équilibreur de charge dans Amazon Lightsail.

Nombre d'hôtes sains (HealthyHostCount) : nombre d'instances cibles considérées saines.
Nombre d'hôtes non sains (UnhealthyHostCount) : nombre d'instances cibles considérées non saines.
Équilibreur de charge HTTP 4XX (HTTPCode_LB_4XX_Count) : nombre de codes d'erreur client HTTP 4XX issus de l'équilibreur de charge. Des erreurs client sont générées lorsque les requêtes sont mal formulées ou sont incomplètes. Ces demandes n'ont pas été reçues par l'instance cible. Ce nombre n'inclut pas les codes de réponse générés par les instances cibles.
Équilibreur de charge HTTP 5XX (HTTPCode_LB_5XX_Count) : nombre de codes d'erreur serveur HTTP 5XX issus de l'équilibreur de charge. Ce nombre n'inclut pas les codes de réponse générés par l'instance cible. Cette métrique est signalée si aucune instance saine n'est attachée à l'équilibreur de charge, ou si le taux de demandes dépasse la capacité des instances (débordement) ou de l'équilibreur de charge.
Instance HTTP 2XX (HTTPCode_Instance_2XX_Count) : nombre de codes de réponse HTTP 2XX générés par les instances cibles. Ce nombre n'inclut pas les codes de réponse générés par l'équilibreur de charge.
Instance HTTP 3XX (HTTPCode_Instance_3XX_Count) : nombre de codes de réponse HTTP 3XX générés par les instances cibles. Ce nombre n'inclut pas les codes de réponse générés par l'équilibreur de charge.
Instance HTTP 4XX (HTTPCode_Instance_4XX_Count) : nombre de codes de réponse HTTP 4XX générés par les instances cibles. Ce nombre n'inclut pas les codes de réponse générés par l'équilibreur de charge.
Instance HTTP 5XX (HTTPCode_Instance_5XX_Count) : nombre de codes de réponse HTTP 5XX générés par les instances cibles. Ce nombre n'inclut pas les codes de réponse générés par l'équilibreur de charge.
Temps de réponse de l'instance (InstanceResponseTime) : temps écoulé, en secondes, entre le moment où la demande quitte l'équilibreur de charge et le moment où une réponse de l'instance cible arrive.
Nombre d'erreurs de négociation TLS du client (ClientTLSNegotiationErrorCount) : nombre de connexions TLS initiées par le client qui n'ont pas établi de session avec l'équilibreur de charge en raison d'une erreur TLS générée par l'équilibreur de charge. Les causes possibles peuvent être une différence de chiffrements ou de protocoles.
Nombre de demandes (RequestCount) : nombre de demandes traitées sur IPv4. Ce nombre inclut uniquement les requêtes avec une réponse générée par une instance cible de l'équilibreur de charge.
Nombre de connexions rejetées (RejectedConnectionCount) : nombre de connexions rejetées parce que l'équilibreur de charge a atteint le nombre maximal de connexions.

Métriques de service de conteneur

Les métriques de service de conteneur suivantes sont disponibles. Pour plus d'informations, veuillez consulter Affichage des métriques de service de conteneur.

Utilisation du processeur (CPUUtilization) : pourcentage moyen d'unités de calcul actuellement utilisées sur tous les nœuds de votre service de conteneur. Cette métrique identifie la puissance de traitement requise pour exécuter des conteneurs sur votre service de conteneur.
Utilisation de la mémoire (MemoryUtilization) : pourcentage moyen de mémoire actuellement utilisée sur tous les nœuds de votre service de conteneur. Cette métrique identifie la mémoire requise pour exécuter des conteneurs sur votre service de conteneur.

Métriques de compartiment

Les métriques de compartiment suivantes sont disponibles. Pour plus d'informations, consultez la section Affichage des métriques des compartiments dans Amazon Lightsail.

Taille de compartiment (BucketSizeBytes) : volume de données stockées dans un compartiment. Cette valeur est calculée en effectuant la somme des tailles de tous les objets au sein du compartiment (versions actuelles et anciennes des objets incluses), ce qui comprend également la taille de toutes les parties pour tous les chargements partitionnés incomplets vers le compartiment.
Nombre d'objets (NumberOfObjects) : nombre total d'objets stockés dans un compartiment. Cette valeur est calculée en comptant tous les objets au sein du compartiment (versions actuelles et anciennes des objets incluses) ainsi que le nombre total de parties pour tous les chargements partitionnés incomplets vers le compartiment.

Note

Les données de mesure de compartiment ne sont pas indiquées lorsque votre compartiment est vide.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Validation de conformité

Métriques d'état des ressources