Résoudre les problèmes liés aux instances défectueuses dans Amazon EC2 Auto Scaling - Amazon EC2 Auto Scaling

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résoudre les problèmes liés aux instances défectueuses dans Amazon EC2 Auto Scaling

Vous trouverez ci-dessous les messages d'erreur renvoyés par Amazon EC2 Auto Scaling, les causes potentielles et les mesures que vous pouvez prendre pour résoudre les problèmes.

Pour récupérer un message d'erreur, consultez Afficher le motif des échecs d’une surveillance de l’état.

Une instance a été mise hors service en réponse à un échec de surveillance de l'état de l'instance EC2

Problème : les instances Auto Scaling échouent aux surveillances de l'état d'Amazon EC2.

Cause 1 : Si des problèmes amènent Amazon EC2 à considérer que les instances de votre groupe Auto Scaling sont altérées, Amazon EC2 Auto Scaling remplace automatiquement les instances dans le cadre de ses bilans de santé.

Solution 1 : Lorsqu'une vérification de l'état d'une instance échoue, vous devez généralement résoudre le problème vous-même en modifiant la configuration de l'instance jusqu'à ce que votre application ne présente plus aucun problème. Pour résoudre ce problème, procédez comme suit :

  1. Créez manuellement une instance Amazon EC2 qui ne fait pas partie du groupe Auto Scaling et examinez le problème. Pour obtenir de l'aide générale sur les instances défectueuses, consultez Résoudre les problèmes liés aux instances dont les vérifications de statut ont échoué dans le guide de l'utilisateur Amazon EC2 et Résolution des problèmes liés aux instances Windows dans le guide de l'utilisateur Amazon EC2.

  2. Après avoir confirmé que votre instance a été lancée avec succès et qu'elle est saine, déployez une nouvelle configuration d'instance sans erreur dans le groupe Auto Scaling.

  3. Supprimez l'instance que vous avez créée pour éviter les frais continus de votre instance AWS .

Une instance a été mise hors service en réponse à une surveillance de l'état EC2 qui indiquait qu'elle avait été résiliée ou arrêtée

Problème : les instances Auto Scaling qui ont été arrêtées, redémarrées ou résiliées sont remplacées.

Cause 1 : un utilisateur a arrêté, redémarré ou résilié l'instance manuellement.

Solution 1 : si vous devez arrêter ou redémarrer les instances de votre groupe Auto Scaling, nous vous recommandons de les mettre d'abord en veille. Pour plus d’informations, consultez Supprimer temporairement des instances du groupe Auto Scaling.

Cause 2 : Amazon EC2 Auto Scaling tente de remplacer les instances Spot après que le service Amazon EC2 Spot interrompe les instances, car le prix Spot augmente au-dessus de votre prix maximum ou capacité n'est plus disponible.

Solution 2 : il n'y a aucune garantie qu'une instance Spot existe pour répondre à la demande à un moment donné. Cependant, vous pouvez essayer l'une des actions suivantes :

  • Utilisez un prix maximum Spot plus élevé (éventuellement prix à la demande). En fixant votre prix maximum plus élevé, cela donne au service Amazon EC2 Spot plus de chances de lancer et de maintenir la quantité de capacité requise.

  • Augmentez le nombre de pools de capacités différents à partir desquels vous pouvez lancer des instances en exécutant plusieurs types d'instances dans plusieurs zones de disponibilité. Pour plus d’informations, consultez Groupes Auto Scaling combinant plusieurs types d'instances et options d'achat.

  • Si vous utilisez plusieurs types d'instance, envisagez d'activer la fonction de Rééquilibrage de capacité. Ceci est utile si vous souhaitez que le service Amazon EC2 Ponctuel tente de lancer une nouvelle instance Spot avant qu'une instance en cours d'exécution ne soit résiliée. Pour plus d’informations, consultez Utiliser le rééquilibrage de la capacité pour gérer les interruptions Spot Amazon EC2.

Cause 3 : avec les blocs de capacité, Amazon EC2 met fin à toutes les instances encore en cours d'exécution 30 minutes avant l'heure de fin du bloc de capacité. Cette interruption abrupte pousse votre groupe Auto Scaling à essayer de lancer de nouvelles instances pour maintenir la capacité souhaitée, alors même que le bloc de capacité touche à sa fin.

Solution 3 : pour résoudre ce problème, essayez ce qui suit :

Une instance a été mise hors service en réponse à une défaillance de la surveillance de l'état du système ELB

Problème : les instances Auto Scaling peuvent réussir aux surveillances de l'état EC2. Cependant, elles peuvent échouer aux surveillances de l'état Elastic Load Balancing pour les groupes cibles ou les équilibreurs de charge classiques auprès desquels le groupe Auto Scaling est enregistré.

Cause 1 : si votre groupe Auto Scaling s'appuie sur les tests de santé fournis par Elastic Load Balancing, Amazon EC2 Auto Scaling détermine l'état de santé de vos instances en vérifiant les résultats des contrôles d'état EC2 et des tests de santé d'Elastic Load Balancing. L'équilibreur de charge effectue des surveillances de l'état en envoyant une requête à chaque instance et en attendant la réponse correcte, ou en établissant une connexion avec l'instance. Une instance peut ne pas réussir la surveillance de l'état Elastic Load Balancing, parce qu'une application s'exécutant sur l'instance connaît des problèmes faisant que l'équilibreur de charge considère l'instance comme étant hors service.

Solution 1 : pour réussir les surveillances de l'état Elastic Load Balancing :

  • Vérifiez que les paramètres de surveillance de l'état de vos groupes cibles sont correctement configurés. Vous définissez des paramètres de surveillance de l'état de votre équilibreur de charge pour chaque groupe cible. Pour plus d’informations, consultez Configuration des contrôles de santé pour les cibles.

  • Notez les codes de réussite attendus par l'équilibreur de charge et si votre application est configurée correctement pour renvoyer ces codes lorsque la surveillance de l'état est concluante.

  • Vérifiez que les groupes de sécurité de votre équilibreur de charge et de votre groupe Auto Scaling sont correctement configurés.

  • Vérifiez que l'équilibreur de charge est configuré dans les mêmes zones de disponibilité que votre groupe Auto Scaling.

Solution 2 : mettez à jour le groupe Auto Scaling pour désactiver les surveillances de l'état Elastic Load Balancing. Pour obtenir des instructions sur la façon de désactiver ces contrôles de santé, consultezAssociez un équilibreur de charge Elastic Load Balancing à votre groupe Auto Scaling.

Cause 2 : il y a une discordance entre la période de grâce de surveillance de l'état et l'heure de démarrage de l'instance.

Solution 3 : modifier le délai de grâce du bilan de santé de votre groupe Auto Scaling. Définissez la période de grâce sur une période suffisamment longue pour prendre en charge le nombre de tests de santé réussis consécutifs requis avant qu'Elastic Load Balancing considère qu'une instance nouvellement lancée est saine. Pour plus d’informations, consultez Définir la période de grâce de la surveillance de l'état pour un groupe Auto Scaling.

Ressources supplémentaires

Si vous rencontrez un autre problème, consultez les AWS re:Post articles suivants pour obtenir une aide supplémentaire en matière de résolution des problèmes :