Une instance a été mise hors service en réponse à un échec de vérification de l'état de l'EC2instance Une instance a été mise hors service en réponse à un bilan de EC2 santé indiquant qu'elle avait été interrompue ou arrêtée.Une instance a été mise hors service en réponse à un échec du bilan de santé ELB du système Ressources supplémentaires

Résoudre les problèmes liés aux instances défectueuses dans Amazon EC2 Auto Scaling

Vous trouverez ci-dessous les messages d'erreur renvoyés par Amazon EC2 Auto Scaling, les causes potentielles et les mesures que vous pouvez prendre pour résoudre les problèmes.

Pour récupérer un message d'erreur, consultez Afficher le motif des échecs d’une surveillance de l’état.

Messages d’erreur

Une instance a été mise hors service en réponse à un échec de vérification de l'état de l'EC2instance
Une instance a été mise hors service en réponse à un bilan de EC2 santé indiquant qu'elle avait été interrompue ou arrêtée.
Une instance a été mise hors service en réponse à un échec du bilan de santé ELB du système
Ressources supplémentaires

Une instance a été mise hors service en réponse à un échec de vérification de l'état de l'EC2instance

Problème : les instances Auto Scaling échouent aux vérifications EC2 de statut Amazon.

Cause 1 : Si des problèmes amènent Amazon EC2 à considérer que les instances de votre groupe Auto Scaling sont altérées, Amazon EC2 Auto Scaling les remplace automatiquement dans le cadre de ses bilans de santé.

Solution 1 : Lorsqu'une vérification de l'état d'une instance échoue, vous devez généralement résoudre le problème vous-même en modifiant la configuration de l'instance jusqu'à ce que votre application ne présente plus aucun problème. Pour résoudre ce problème, procédez comme suit :

Créez manuellement une EC2 instance Amazon qui ne fait pas partie du groupe Auto Scaling et étudiez le problème. Pour obtenir de l'aide générale sur les instances défectueuses, consultez Résoudre les problèmes liés aux instances dont les vérifications de statut ont échoué dans le guide de EC2 l'utilisateur Amazon et résolution des problèmes liés aux instances Windows dans le guide de EC2 l'utilisateur Amazon.
Après avoir confirmé que votre instance a été lancée avec succès et qu'elle est saine, déployez une nouvelle configuration d'instance sans erreur dans le groupe Auto Scaling.
Supprimez l'instance que vous avez créée pour éviter les frais continus de votre instance AWS .

Une instance a été mise hors service en réponse à un bilan de EC2 santé indiquant qu'elle avait été interrompue ou arrêtée.

Problème : les instances Auto Scaling qui ont été arrêtées, redémarrées ou résiliées sont remplacées.

Cause 1 : un utilisateur a arrêté, redémarré ou résilié l'instance manuellement.

Solution 1 : si vous devez arrêter ou redémarrer les instances de votre groupe Auto Scaling, nous vous recommandons de les mettre d'abord en veille. Pour de plus amples informations, veuillez consulter Supprimer temporairement des instances du groupe Auto Scaling.

Cause 2 : Amazon EC2 Auto Scaling tente de remplacer les instances Spot après que le service Amazon EC2 Spot les ait interrompues, car le prix au comptant supérieur à votre prix maximum ou à votre capacité maximale n'est plus disponible.

Solution 2 : il n'y a aucune garantie qu'une instance Spot existe pour répondre à la demande à un moment donné. Cependant, vous pouvez essayer l'une des actions suivantes :

Utilisez un prix maximum Spot plus élevé (éventuellement prix à la demande). En augmentant votre prix maximum, le service Amazon EC2 Spot a de meilleures chances de lancer et de maintenir la capacité requise.
Augmentez le nombre de pools de capacités différents à partir desquels vous pouvez lancer des instances en exécutant plusieurs types d'instances dans plusieurs zones de disponibilité. Pour de plus amples informations, veuillez consulter Groupes Auto Scaling combinant plusieurs types d'instances et options d'achat.
Si vous utilisez plusieurs types d'instance, envisagez d'activer la fonction de Rééquilibrage de capacité. Cela est utile si vous souhaitez que le service Amazon EC2 Spot tente de lancer une nouvelle instance Spot avant qu'une instance en cours d'exécution ne soit arrêtée. Pour de plus amples informations, veuillez consulter Utiliser le rééquilibrage de la capacité pour gérer les interruptions Spot Amazon EC2.

Cause 3 : avec les blocs de capacité, Amazon EC2 met fin à toutes les instances encore en cours d'exécution 30 minutes avant l'heure de fin du bloc de capacité. Cette interruption abrupte pousse votre groupe Auto Scaling à essayer de lancer de nouvelles instances afin de maintenir la capacité souhaitée, même lorsque le bloc de capacité touche à sa fin.

Solution 3 : pour résoudre ce problème, essayez ce qui suit :

Diminuez la capacité souhaitée du groupe Auto Scaling pour l'empêcher de lancer de nouvelles instances. Pour de plus amples informations, veuillez consulter Dimensionnement manuel pour Amazon EC2 Auto Scaling.
Assurez-vous de redimensionner votre groupe Auto Scaling 30 minutes avant l'heure de fin du Capacity Block afin de ne pas rencontrer cette erreur fréquemment. Assurez-vous que tous les hooks du cycle de vie sont terminés 30 minutes avant la fin du bloc de capacité. Pour de plus amples informations, veuillez consulter Utiliser Capacity Blocks pour les charges de travail liées au machine learning.

Une instance a été mise hors service en réponse à un échec du bilan de santé ELB du système

Problème : les instances Auto Scaling peuvent réussir les vérifications EC2 d'état. Cependant, elles peuvent échouer aux surveillances de l'état Elastic Load Balancing pour les groupes cibles ou les équilibreurs de charge classiques auprès desquels le groupe Auto Scaling est enregistré.

Cause 1 : si votre groupe Auto Scaling s'appuie sur les bilans de santé fournis par Elastic Load Balancing, Amazon EC2 Auto Scaling détermine l'état de santé de vos instances en vérifiant les résultats des contrôles d'EC2état et des bilans de santé d'Elastic Load Balancing. L'équilibreur de charge effectue des surveillances de l'état en envoyant une requête à chaque instance et en attendant la réponse correcte, ou en établissant une connexion avec l'instance. Une instance peut ne pas réussir la surveillance de l'état Elastic Load Balancing, parce qu'une application s'exécutant sur l'instance connaît des problèmes faisant que l'équilibreur de charge considère l'instance comme étant hors service.

Solution 1 : pour réussir les surveillances de l'état Elastic Load Balancing :

Vérifiez que les paramètres de surveillance de l'état de vos groupes cibles sont correctement configurés. Vous définissez des paramètres de surveillance de l'état de votre équilibreur de charge pour chaque groupe cible. Pour de plus amples informations, veuillez consulter Configuration des contrôles de santé pour les cibles.
Notez les codes de réussite attendus par l'équilibreur de charge et si votre application est configurée correctement pour renvoyer ces codes lorsque la surveillance de l'état est concluante.
Vérifiez que les groupes de sécurité de votre équilibreur de charge et de votre groupe Auto Scaling sont correctement configurés.
Vérifiez que l'équilibreur de charge est configuré dans les mêmes zones de disponibilité que votre groupe Auto Scaling.

Solution 2 : mettez à jour le groupe Auto Scaling pour désactiver les surveillances de l'état Elastic Load Balancing. Pour obtenir des instructions sur la façon de désactiver ces contrôles de santé, consultezAssociez un équilibreur de charge Elastic Load Balancing à votre groupe Auto Scaling.

Cause 2 : il y a une discordance entre la période de grâce de surveillance de l'état et l'heure de démarrage de l'instance.

Solution 3 : modifier le délai de grâce du bilan de santé de votre groupe Auto Scaling. Définissez la période de grâce sur une période suffisamment longue pour prendre en charge le nombre de tests de santé réussis consécutifs requis avant qu'Elastic Load Balancing considère qu'une instance nouvellement lancée est saine. Pour de plus amples informations, veuillez consulter Définir la période de grâce de la surveillance de l'état pour un groupe Auto Scaling.

Ressources supplémentaires

Si vous rencontrez un autre problème, consultez les AWS re:Post articles suivants pour obtenir une aide supplémentaire en matière de résolution des problèmes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Afficher le motif des échecs d’une surveillance de l’état

Moniteur avec AWS Health Dashboard