Statusprüfungen für Ihre Instances - Amazon Elastic Compute Cloud

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Statusprüfungen für Ihre Instances

Mithilfe der Statusüberwachung für Instances können Sie schnell ermitteln, ob Amazon EC2 Probleme erkannt hat, die Ihre Instances möglicherweise daran hindern, Anwendungen auszuführen. Amazon EC2 führt automatisierte Prüfungen bei jeder laufenden EC2-Instance durch, um Hardware- und Softwareprobleme zu identifizieren. Sie können die Ergebnisse dieser Statusprüfungen anzeigen, um bestimmte bzw. erkennbare Probleme zu ermitteln. Die Daten zum Ereignisstatus ergänzen die Informationen, die Amazon EC2 bereits über den Status der einzelnen Instances (wiepending,running,stopping) und die von Amazon CloudWatch überwachten Nutzungsmetriken (CPU-Auslastung, Netzwerkverkehr und Festplattenaktivität) bereitstellt.

Statusprüfungen werden minütlich durchgeführt und geben als Status "Bestanden" oder "Fehler" zurück. Wenn alle Überprüfungen bestanden wurden, lautet der Gesamtstatus der Instance OK. Falls mindestens eine Überprüfung nicht bestanden wird, lautet der Gesamtstatus impaired (beeinträchtigt). Statusprüfungen sind in Amazon EC2 integriert und können daher nicht deaktiviert oder gelöscht werden.

Wenn eine Statusüberprüfung fehlschlägt, wird die entsprechende CloudWatch Metrik für Statusprüfungen inkrementiert. Weitere Informationen finden Sie unter Statusprüfungsmetriken. Sie können diese Metriken verwenden, um CloudWatch Alarme zu erstellen, die auf der Grundlage des Ergebnisses der Statusprüfungen ausgelöst werden. Beispielsweise können Sie einen Alarm erstellen, mit dem Sie gewarnt werden, wenn Statusprüfungen für eine bestimmte Instance fehlschlagen. Weitere Informationen finden Sie unter Erstellen und Bearbeiten von Statusprüfungsalarmen.

Sie können auch einen CloudWatch Amazon-Alarm erstellen, der eine Amazon EC2-Instance überwacht und die Instance automatisch wiederherstellt, wenn sie aufgrund eines zugrunde liegenden Problems beeinträchtigt wird. Weitere Informationen finden Sie unter Resilienz der Instanz.

Arten von Statusprüfungen

Es gibt drei Arten von Statusprüfungen.

System-Statusprüfungen

Systemstatusprüfungen überwachen die AWS Systeme, auf denen Ihre Instance ausgeführt wird. Bei diesen Überprüfungen werden die zugrunde liegenden Probleme Ihrer Instance erkannt, für die zur Reparatur die Beteiligung von AWS erforderlich ist. Wenn eine Systemstatusprüfung fehlschlägt, können Sie wählen, ob Sie warten AWS möchten, bis das Problem behoben ist, oder Sie können es selbst lösen. Für von Amazon EBS unterstützte Instances können Sie die Instance selbst stoppen und starten, was in den meisten Fällen dazu führt, dass die Instance auf einen neuen Host migriert wird. Für Linux-Instances mit Unterstützung durch Instance-Speicher können Sie die Instance beenden und ersetzen. Bei Windows-Instances muss das Stamm-Volume ein Amazon EBS-Volume sein. Der Instance-Speicher wird für das Stamm-Volume nicht unterstützt. Beachten Sie, dass Instance-Speicher-Volumes kurzlebig sind und alle Daten verloren gehen, wenn die Instance gestoppt wird.

Hier sind Beispiele für Probleme aufgeführt, die dazu führen können, dass System-Statusprüfungen fehlschlagen:

  • Verlust der Netzwerkverbindung

  • Systemstromausfall

  • Softwareprobleme auf dem physischen Host

  • Hardwareprobleme auf dem physischen Host, die die Erreichbarkeit des Netzwerks beeinträchtigen

Wenn eine Systemstatusprüfung fehlschlägt, erhöhen wir die Metrik StatusCheckFailed_System.

Bare Metal-Instances

Wenn Sie einen Neustart vom Betriebssystem auf einer Bare-Metal-Instance durchführen, gibt die Systemstatusprüfung möglicherweise vorübergehend einen Fehlerstatus zurück. Wenn die Instance verfügbar ist, sollte die Systemstatusprüfung einen Passstatus zurückgeben.

Instance-Statusprüfungen

Instance Status Checks (Instance-Statusprüfungen) Überwachen Sie die Software- und Netzwerkkonfiguration Ihrer individuellen Instance. Amazon EC2 überprüft den Zustand der Instance, indem es eine ARP-Anfrage (Address Resolution Protocol) an die Netzwerkschnittstelle (NIC) sendet. Bei diesen Überprüfungen werden Probleme Ihrer Instance erkannt, für die zur Reparatur Ihre Beteiligung erforderlich ist. Wenn eine Instance-Statusprüfung nicht bestanden wird, müssen Sie das Problem normalerweise selbst lösen (z. B. per Neustart der Instance oder durch das Vornehmen von Konfigurationsänderungen für die Instance).

Anmerkung

Neuere Linux-Distributionen, die die Netzwerkkonfiguration verwendensystemd-networkd, berichten möglicherweise anders über Integritätsprüfungen als frühere Distributionen. Während des Startvorgangs kann dieser Netzwerktyp früher gestartet und möglicherweise vor anderen Startaufgaben beendet werden, die sich ebenfalls auf den Zustand der Instance auswirken können. Statusprüfungen, die von der Netzwerkverfügbarkeit abhängen, können einen fehlerfreien Status melden, bevor andere Aufgaben abgeschlossen sind.

Hier sind Beispiele für Probleme aufgeführt, die dazu führen können, dass Instance-Statusprüfungen fehlschlagen:

  • Fehlgeschlagene System-Statusprüfungen

  • Fehlerhafte Netzwerk- oder Startup-Konfiguration

  • Unzureichender Speicher

  • Beschädigtes Dateisystem

  • Inkompatibler Kernel

  • [Windows-Instanzen] Während des Neustarts einer Instanz oder während der Bündelung einer durch den Windows-Instanzspeicher gestützten Instanz wird bei einer Instanzstatusprüfung ein Fehler gemeldet, bis die Instanz wieder verfügbar ist.

Wenn eine Überprüfung des Instance-Status fehlschlägt, erhöhen wir die Metrik Failed_Instance. StatusCheck

Bare Metal-Instances

Wenn Sie einen Neustart des Betriebssystems auf einer Bare-Metal-Instance durchführen, gibt die Instance-Statusprüfung möglicherweise vorübergehend einen Fehlerstatus zurück. Wenn die Instance verfügbar wird, sollte die Instance-Statusprüfung einen Passstatus zurückgeben.

Verknüpfte EBS-Statusprüfungen

Verknüpfte EBS-Statusprüfungen überwachen, ob die an eine Instance angehängten Amazon EBS-Volumes erreichbar sind und I/O-Operationen abschließen können. Die StatusCheckFailed_AttachedEBS-Metrik ist ein binärer Wert, der auf eine Beeinträchtigung hinweist, wenn eines oder mehrere der an die Instance angehängten EBS-Volumes I/O-Operationen nicht abschließen können. Diese Statusprüfungen erkennen grundlegende Probleme mit der Datenverarbeitungs- oder Amazon EBS-Infrastruktur. Wenn die angehängte EBS-Statusprüf-Metrik fehlschlägt, können Sie entweder warten, AWS bis das Problem behoben ist, oder Sie können Maßnahmen ergreifen, z. B. die betroffenen Volumes austauschen oder die Instance beenden und neu starten.

Hier sind Beispiele für Probleme aufgeführt, die dazu führen können, dass angehängte EBS-Statusprüfungen fehlschlagen:

  • Hardware- oder Softwareprobleme auf den Speichersubsystemen, die den EBS-Volumes zugrunde liegen

  • Hardwareprobleme auf dem physischen Host, die die Erreichbarkeit der EBS-Volumes beeinträchtigen

  • Verbindungsprobleme zwischen der Instance und den EBS-Volumes

Sie können die StatusCheckFailed_AttachedEBS-Metrik verwenden, um die Stabilität Ihres Workloads zu verbessern. Sie können diese Metrik verwenden, um CloudWatch Amazon-Alarme zu erstellen, die auf der Grundlage des Ergebnisses der Statusprüfung ausgelöst werden. Sie könnten beispielsweise ein Failover auf eine sekundäre Instance oder Availability Zone durchführen, wenn Sie eine anhaltende Auswirkung feststellen. Alternativ können Sie die I/O-Leistung jedes angeschlossenen Volumes mithilfe von CloudWatch EBS-Metriken überwachen, um das beschädigte Volume zu erkennen und zu ersetzen. Wenn Ihre Workload die I/O zu keinem der mit Ihrer Instance verknüpften EBS-Volumes steuert und die verknüpfte EBS-Statusprüfung auf eine Beeinträchtigung hinweist, können Sie die Instance beenden und neu starten, um Probleme mit dem physischen Host zu beheben, die sich auf die Erreichbarkeit der EBS-Volumes auswirken. Weitere Informationen finden Sie unter CloudWatch Amazon-Metriken für Amazon EBS

Anmerkung
  • Die verknüpfte EBS-Statusprüfungsmetrik ist nur für Nitro-Instances verfügbar.

  • Sie können die angehängte Metrik zur EBS-Statusprüfung überwachen, indem Sie auf der Grundlage der StatusCheckFailed_AttachedEBS Metrik einen CloudWatch Alarm erstellen. Sie können diese Statusprüfung nicht mit dem Befehl AWS CLI describe-instance-status anzeigen.

Mit Statusprüfungen arbeiten

Sie können mit Statusprüfungen arbeiten, indem Sie die Konsole und Befehlszeilentools verwenden, wie z. B. die AWS CLI.

Anzeigen der Statusprüfungen

Verwenden Sie eine der folgenden Methoden, um Statusprüfungen anzuzeigen.

Console
Anzeigen der Statusprüfungen
  1. Öffnen Sie die Amazon EC2-Konsole unter https://console.aws.amazon.com/ec2/.

  2. Wählen Sie im Navigationsbereich Instances aus.

  3. Auf der Seite Instances ist in der Spalte Statusprüfungen jeweils der Betriebszustand einer Instance angegeben.

  4. Wählen Sie die Instance aus, um ihren Status anzuzeigen, und wählen Sie anschließend die Registerkarte Status und Alarme.

    Zeigen Sie die Instance-Statusprüfungen auf der Registerkarte Status und Alarme an.

    Wenn Ihre Instance eine nicht bestandene Statusprüfung aufweist, müssen Sie das Problem normalerweise selbst lösen (z. B. per Neustart der Instance oder durch das Vornehmen von Konfigurationsänderungen für die Instance). Informationen zur Behebung von Fehlern bei der System- oder Instanzstatusprüfung auf Linux-Instances finden Sie unter. Beheben Sie Linux-Instances mit fehlgeschlagenen Statusprüfungen

  5. Um die CloudWatch Metriken für Statuschecks zu überprüfen, erweitern Sie auf der Registerkarte Status und Alarme die Option Metriken, um die Grafiken für die folgenden Metriken anzuzeigen:

    • Statusprüfung für System fehlgeschlagen

    • Statusprüfung für Instance fehlgeschlagen

    Weitere Informationen finden Sie unter Statusprüfungsmetriken.

Command line

Sie können Statusprüfungen für ausgeführte Instances anzeigen, indem Sie den Befehl describe-instance-status (AWS CLI) verwenden.

Verwenden Sie den folgenden Befehl, um den Status aller Instances anzuzeigen.

aws ec2 describe-instance-status

Führen Sie den folgenden Befehl aus, um den Status aller Instances mit dem Instance-Status impaired anzufordern.

aws ec2 describe-instance-status \ --filters Name=instance-status.status,Values=impaired

Verwenden Sie den folgenden Befehl, um den Status einer einzelnen Instance abzurufen.

aws ec2 describe-instance-status \ --instance-ids i-1234567890abcdef0

Alternativ können Sie die folgenden -Befehle verwenden:

Wenn Sie über eine Linux-Instance verfügen, bei der die Statusprüfung fehlgeschlagen ist, finden Sie weitere Informationen unterBeheben Sie Linux-Instances mit fehlgeschlagenen Statusprüfungen.

Erstellen und Bearbeiten von Statusprüfungsalarmen

Sie können die Metriken für die Statusprüfung verwenden, um CloudWatch Alarme zu erstellen, die Sie benachrichtigen, wenn bei einer Instance eine Statusprüfung nicht bestanden hat.

Wichtig

Bei Statusprüfungen und Alarmen für Statusprüfungen kann es vorübergehend zu einem unzureichenden Datenstatus kommen, wenn Metrikdatenpunkte fehlen. Das ist zwar selten, kann aber passieren, wenn es zu einer Unterbrechung der metrischen Berichtssysteme kommt, selbst wenn eine Instanz fehlerfrei ist. Wir empfehlen, diesen Status als fehlende Daten zu behandeln und nicht als Fehlschlag bei der Statusüberprüfung oder als Alarmverletzung. Dies gilt insbesondere dann, wenn als Reaktion Aktionen zum Stoppen, Beenden, Neustarten oder Wiederherstellen der Instance ergriffen werden.

Verwenden Sie eine der folgenden Methoden, um einen Alarm für die Statusprüfung zu erstellen:

Console

Gehen Sie wie folgt vor, um einen Alarm zu konfigurieren, der Ihnen eine Benachrichtigung per E-Mail sendet oder eine Instance bei nicht bestandener Statusprüfung anhält, beendet oder wiederherstellt.

So erstellen Sie einen Statusprüfungsalarm
  1. Öffnen Sie die Amazon EC2-Konsole unter https://console.aws.amazon.com/ec2/.

  2. Wählen Sie im Navigationsbereich Instances aus.

  3. Wählen Sie die Instance, dann die Registerkarte Statusprüfungen und Aktionen, Statusprüfalarm erstellen aus.

  4. Wählen Sie auf der Seite CloudWatch Alarme verwalten unter Alarm hinzufügen oder bearbeiten die Option Alarm erstellen aus.

  5. Aktivieren Sie für Alarmbenachrichtigung den Schalter, um Amazon Simple Notification Service (Amazon SNS) -Benachrichtigungen zu konfigurieren. Wählen Sie ein vorhandenes Amazon SNS-Thema aus oder geben Sie einen Namen ein, um ein neues Thema zu erstellen.

    Wenn Sie der Liste mit den Empfängern eine E-Mail-Adresse hinzugefügt oder ein neues Thema erstellt haben, sendet Amazon SNS an jede neue Adresse eine Bestätigungs-E-Mail, um die Abonnierung zu bestätigen. Jeder Empfänger muss die Abonnierung bestätigen, indem er in dieser Nachricht auf den Link klickt. Warnungsbenachrichtigungen werden nur an bestätigte Adressen gesendet.

  6. Aktivieren Sie für Alarmaktion den Schalter, um eine Aktion anzugeben, die ausgeführt werden soll, wenn der Alarm ausgelöst wird. Wählen Sie die Aktion aus.

  7. Wählen Sie unter larm thresholds (Alarmschwellenwerte) die Metrik und Kriterien für den Alarm aus.

    Sie können die Standardeinstellungen für Group samples by (Beispiele gruppieren nach) (Average (Durchschnitt)) und für Type of data to sample (Datentypen für die Probenahme) (Status check failed:either) (Statusprüfung ist fehlgeschlagen:beide) übernehmen oder an Ihre Anforderungen anpassen.

    Legen Sie unter Consecutive period (Kontinuierlicher Zeitraum) die Anzahl von Zeiträumen fest, die ausgewertet werden sollen, und wählen Sie unter Period (Zeitraum) die Dauer des Auswertungszeitraums aus, nach dem der Alarm ausgelöst und eine E-Mail gesendet wird.

  8. (Optional) Wählen Sie für Beispiel-Metrikdaten die Option Zu Dashboard hinzufügen aus.

  9. Wählen Sie Create (Erstellen) aus.

Falls Sie Änderungen an einem Alarm zum Instance-Status vornehmen möchten, können Sie ihn bearbeiten.

Erstellen eines Ereignisfensters
  1. Öffnen Sie die Amazon EC2-Konsole unter https://console.aws.amazon.com/ec2/.

  2. Wählen Sie im Navigationsbereich Instances aus.

  3. Wählen Sie die Instanz aus und wählen Sie Aktionen, Überwachung, CloudWatch Alarme verwalten aus.

  4. Wählen Sie auf der Seite CloudWatch Alarme verwalten unter Alarm hinzufügen oder bearbeiten die Option Alarm bearbeiten aus.

  5. Wählen Sie unter Search for alarm (Alarmsuche) den Alarm aus.

  6. Wenn Sie die Änderungen vorgenommen haben, wählen Sie Update (Aktualisieren) aus.

Command line

Im folgenden Beispiel veröffentlicht der Alarm eine Benachrichtigung für das SNS-Thema arn:aws:sns:us-west-2:111122223333:my-sns-topic, wenn die Instance die Instance- oder System-Statusprüfung in mindestens zwei aufeinanderfolgenden Zeiträumen nicht besteht. Die verwendete CloudWatch Metrik istStatusCheckFailed.

Um einen Alarm für die Statusprüfung mit dem zu erstellen AWS CLI
  1. Wählen Sie ein vorhandenes SNS-Thema aus oder erstellen Sie ein neues Thema. Weitere Informationen finden Sie unter Using AWS CLI the with Amazon SNS im AWS Command Line Interface Benutzerhandbuch.

  2. Verwenden Sie den folgenden Befehl list-metrics, um die verfügbaren CloudWatch Amazon-Metriken für Amazon EC2 anzuzeigen.

    aws cloudwatch list-metrics --namespace AWS/EC2
  3. Verwenden Sie den folgenden put-metric-alarm-Befehl, um den Alarm zu erstellen.

    aws cloudwatch put-metric-alarm \ --alarm-name StatusCheckFailed-Alarm-for-i-1234567890abcdef0 \ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0 \ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actions arn:aws:sns:us-west-2:111122223333:my-sns-topic

    Der Zeitraum ist der Zeitraum in Sekunden, in dem CloudWatch Amazon-Metriken erfasst werden. Im Beispiel wird der Wert 300 verwendet, also 60 Sekunden multipliziert mit 5 Minuten. Die Bewertungsperiode ist die Anzahl von aufeinanderfolgenden Zeiträumen, für die der Wert der Metrik mit dem Schwellenwert verglichen werden muss. In diesem Beispiel wird der Wert 2 verwendet. Die Alarmaktionen sind die Aktionen, die durchgeführt werden sollen, wenn dieser Alarm ausgelöst wird. In diesem Beispiel wird der Alarm so konfiguriert, dass mit Amazon SNS eine E-Mail gesendet wird.