Überwachungsplan Leistungsbasislinie Richtlinien zur Leistung

Überwachung von Metriken in einem Amazon-Aurora-Cluster

Amazon Aurora verwendet einen Cluster replizierter Datenbankserver. Das Überwachen eines Aurora-Clusters erfordert in der Regel die Überprüfung des Zustands mehrerer DB-Instances. Die Instances haben möglicherweise spezielle Rollen, die hauptsächlich Schreiboperationen, nur Lesevorgänge oder eine Kombination verarbeiten. Sie überwachen auch den Gesamtzustand des Clusters, indem Sie die Replikationsverzögerung messen. Dabei handelt es sich um die Zeitspanne, in der Änderungen, die von einer DB-Instance vorgenommen wurden, für die anderen Instances verfügbar sind.

Themen

Überwachungsplan

Bevor Sie mit der Überwachung von Amazon Aurora beginnen, sollten Sie einen Überwachungsplan erstellen. Dieser Plan sollte die folgenden Fragen beantworten:

Was sind Ihre Ziele bei der Überwachung?
Welche Ressourcen möchten Sie überwachen?
Wie oft werden diese Ressourcen überwacht?
Welche Überwachungs-Tools möchten Sie verwenden?
Wer soll die Überwachungsaufgaben ausführen?
Wer soll benachrichtigt werden, wenn Fehler auftreten?

Leistungsbasislinie

Um Ihre Überwachungsziele zu erreichen, müssen Sie eine Basislinie erstellen. Messen Sie dazu die Leistung unter unterschiedlichen Lastbedingungen zu verschiedenen Zeiten in Ihrer Amazon Aurora-Umgebung. Sie können Metriken wie die folgenden überwachen:

Netzwerkdurchsatz
Client-Verbindungen
I/O für Lese-, Schreib- oder Metadatenoperationen
Burst-Guthaben für Ihre DB-Instances

Es wird empfohlen, historische Leistungsdaten für Amazon Aurora zu speichern.. Mithilfe der gespeicherten Daten können Sie die aktuelle Leistung mit früheren Trends vergleichen. Sie können so auch normale Leistungsmuster von Anomalien unterscheiden und Methoden zur Behebung von Problemen entwickeln.

Richtlinien zur Leistung

Die zulässigen Werte für Leistungsmetriken sind im Allgemeinen davon abhängig, wie die Basislinie aussieht, und wofür die Anwendung gedacht ist. Prüfen Sie, ob dauerhafte oder tendenzielle Abweichungen von Ihrer Ausgangsbasis vorliegen. Die folgenden Metriken sind häufig die Ursache von Leistungsproblemen:

Hohe CPU- oder RAM-Nutzung – Hohe Werte für die CPU- oder RAM-Nutzung können angemessen sein, wenn sie der Zielsetzung Ihrer Anwendung entsprechen (z. B. in Bezug auf Durchsatz oder Gleichzeitigkeit) und erwartet werden.
Nutzung des Datenträgerplatzes – Überprüfen Sie die Nutzung des Datenträgerplatzes, wenn konsistent 85 Prozent oder mehr des gesamten Datenträgerplatzes belegt werden. Prüfen Sie, ob Daten in der Instance gelöscht oder auf einem anderen System archiviert werden können, um Speicherplatz freizugeben.
Netzwerkdatenverkehr – Wenden Sie sich an Ihren Systemadministrator, um zu erfahren, welcher Durchsatz für Ihr Domänennetzwerk und Ihre Internetverbindung erwartet wird. Überprüfen Sie den Netzwerkdatenverkehr, wenn der Durchsatz dauerhaft unter dem erwarteten Wert liegt.
Datenbankverbindungen – Sie sollten eine Einschränkung der Datenbankverbindungen in Betracht ziehen, wenn eine große Anzahl von Benutzerverbindungen sowie auch eine Abnahme der Instance-Leistung und -Reaktionszeit zu erkennen sind. Die optimale Anzahl der Benutzerverbindungen für Ihre DB-Instance ist von der Instance-Klasse und der Komplexität der ausgeführten Operationen abhängig. Um die Anzahl der Datenbankverbindungen zu bestimmen, ordnen Sie Ihre DB-Instance einer Parametergruppe zu, für die der Parameter User Connections auf einen anderen Wert als „0“ (unbegrenzt) gesetzt ist. Sie können eine entweder eine vorhandene Parametergruppe verwenden oder eine neue erstellen. Weitere Informationen finden Sie unter Parametergruppen für Amazon Aurora.
IOPS-Metriken – Die erwarteten Werte für IOPS-Metriken sind von der Datenträgerspezifikation und der Serverkonfiguration abhängig. Verwenden Sie die Basiswerte als typische Werte. Prüfen Sie, ob dauerhafte Abweichungen von den Werten Ihrer Ausgangsbasis vorliegen. Für eine optimale IOPS-Leistung stellen Sie sicher, dass Ihr typisches Working Set in den Speicher passt, um Lese- und Schreibvorgänge zu minimieren.

Wenn die Leistung außerhalb der festgelegten Baseline liegt, müssen Sie möglicherweise Änderungen vornehmen, um die Datenbankverfügbarkeit für Ihre Workload zu optimieren. Beispielsweise müssen Sie möglicherweise die Instance-Klasse Ihrer DB-Instance ändern. Oder Sie müssen möglicherweise die Anzahl der DB-Instance und Read Replicas ändern, die für Clients verfügbar sind.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Wiederherstellen eines DB-Clusters mit dem AWS CLI

Tools zur Überwachung