Résolution des problèmes de haute disponibilité - AWS Storage Gateway

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Résolution des problèmes de haute disponibilité

Vous trouverez ci-dessous des informations sur les actions à entreprendre si vous rencontrez des problèmes de disponibilité.

Notifications d’intégrité

Lorsque vous exécutez votre passerelle sur VMware vSphere HA, toutes les passerelles envoient les notifications de santé suivantes au groupe de journaux Amazon CloudWatch que vous avez configuré. Ces notifications vont dans un flux de journaux appelé AvailabilityMonitor.

Notification : Reboot

Vous pouvez obtenir une notification de redémarrage lorsque la machine virtuelle de la passerelle est redémarrée. Vous pouvez redémarrer une machine virtuelle de passerelle à l'aide de la console de gestion des hyperviseurs de la machine virtuelle ou de la console Storage Gateway. Vous pouvez également la redémarrer à l'aide du logiciel de la passerelle pendant le cycle de maintenance de la passerelle.

Action à exécuter

Si l'heure du redémarrage se situe dans les 10 minutes de l'heure de démarrage de la maintenance configurée de la passerelle, ce redémarrage est probablement une occurrence normale et non un signe de problème. Si le redémarrage s'est produit largement en dehors de la fenêtre de maintenance, vérifiez si la passerelle a été redémarrée manuellement.

Notification : HardReboot

Vous pouvez obtenir une notification HardReboot lorsque la machine virtuelle de la passerelle est redémarrée de façon inattendue. Un tel redémarrage peut être dû à une perte de puissance, à une défaillance matérielle ou à un autre événement. Pour les passerelles VMware, une réinitialisation par la surveillance de l’application vSphere High Availability peut déclencher cet événement.

Action à exécuter

Lorsque votre passerelle s'exécute dans un tel environnement, vérifiez la présence de la notification HealthCheckFailure et consultez le journal des événements VMware pour la machine virtuelle.

Notification : HealthCheckFailure

Pour une passerelle sur VMware vSphere HA, vous pouvez recevoir une notification HealthCheckFailure lorsqu'une vérification de l’état échoue et qu'un redémarrage de la machine virtuelle est demandé. Cet événement se produit également lors d'un test de surveillance de la disponibilité, indiqué par une notification AvailabilityMonitorTest. Dans ce cas, la notification HealthCheckFailure est attendue.

Note

Cette notification concerne uniquement les passerelles VMware.

Action à exécuter

Si cet événement se produit à plusieurs reprises sans notification AvailabilityMonitorTest, recherchez les problèmes éventuels de votre infrastructure de machine virtuelle (stockage, mémoire, etc.). Si vous avez besoin d'une assistance supplémentaire, contactez AWS Support.

Notification : AvailabilityMonitorTest

Pour une passerelle sur VMware vSphere HA, vous pouvez obtenir une notification AvailabilityMonitorTest lorsque vous exécutez un test du système de Surveillance de la disponibilité et des applications dans VMware.

Métriques

La métrique AvailabilityNotifications est disponible sur toutes les passerelles. Cette métrique représente le nombre de notifications d'intégrité liées à la disponibilité et générées par la passerelle. Utilisez la statistique Sum pour observer si la passerelle rencontre des événements liés à la disponibilité. Consultez le groupe de CloudWatch journaux que vous avez configuré pour plus de détails sur les événements.