Überwachung von Metriken in einem Amazon-Aurora-Cluster - Amazon Aurora

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachung von Metriken in einem Amazon-Aurora-Cluster

Amazon Aurora verwendet einen Cluster replizierter Datenbankserver. Das Überwachen eines Aurora-Clusters erfordert in der Regel die Überprüfung des Zustands mehrerer DB-Instances. Die Instances haben möglicherweise spezielle Rollen, die hauptsächlich Schreiboperationen, nur Lesevorgänge oder eine Kombination verarbeiten. Sie überwachen auch den Gesamtzustand des Clusters, indem Sie die Replikationsverzögerung messen. Dabei handelt es sich um die Zeitspanne, in der Änderungen, die von einer DB-Instance vorgenommen wurden, für die anderen Instances verfügbar sind.

Überwachungsplan

Bevor Sie mit der Überwachung von Amazon Aurora beginnen, erstellen Sie einen Überwachungsplan. Dieser Plan sollte die folgenden Fragen beantworten:

  • Was sind Ihre Ziele bei der Überwachung?

  • Welche Ressourcen möchten Sie überwachen?

  • Wie oft werden diese Ressourcen überwacht?

  • Welche Überwachungs-Tools möchten Sie verwenden?

  • Wer soll die Überwachungsaufgaben ausführen?

  • Wer soll benachrichtigt werden, wenn Fehler auftreten?

Leistungsbasislinie

Um Ihre Überwachungsziele zu erreichen, müssen Sie eine Basislinie erstellen. Messen Sie dazu die Leistung unter verschiedenen Lastbedingungen zu verschiedenen Zeiten in Ihrer Aurora Aurora-Umgebung. Sie können Metriken wie die folgenden überwachen:

  • Netzwerkdurchsatz

  • Client-Verbindungen

  • I/O für Lese-, Schreib- oder Metadatenoperationen

  • Burst-Guthaben für Ihre DB-Instances

Wir empfehlen, historische Leistungsdaten für Aurora zu speichern. Mithilfe der gespeicherten Daten können Sie die aktuelle Leistung mit früheren Trends vergleichen. Sie können so auch normale Leistungsmuster von Anomalien unterscheiden und Methoden zur Behebung von Problemen entwickeln.

Richtlinien zur Leistung

Die zulässigen Werte für Leistungsmetriken sind im Allgemeinen davon abhängig, wie die Basislinie aussieht, und wofür die Anwendung gedacht ist. Prüfen Sie, ob dauerhafte oder tendenzielle Abweichungen von Ihrer Ausgangsbasis vorliegen. Die folgenden Metriken sind häufig die Ursache von Leistungsproblemen:

  • Hoch CPU oder RAM Verbrauch — Hohe Werte für CPU oder RAM Verbrauch können angemessen sein, wenn sie Ihren Zielen für Ihre Anwendung (wie Durchsatz oder Parallelität) entsprechen und erwartet werden.

  • Nutzung des Datenträgerplatzes – Überprüfen Sie die Nutzung des Datenträgerplatzes, wenn konsistent 85 Prozent oder mehr des gesamten Datenträgerplatzes belegt werden. Prüfen Sie, ob Daten in der Instance gelöscht oder auf einem anderen System archiviert werden können, um Speicherplatz freizugeben.

  • Netzwerkdatenverkehr – Wenden Sie sich an Ihren Systemadministrator, um zu erfahren, welcher Durchsatz für Ihr Domänennetzwerk und Ihre Internetverbindung erwartet wird. Überprüfen Sie den Netzwerkdatenverkehr, wenn der Durchsatz dauerhaft unter dem erwarteten Wert liegt.

  • Datenbankverbindungen – Sie sollten eine Einschränkung der Datenbankverbindungen in Betracht ziehen, wenn eine große Anzahl von Benutzerverbindungen sowie auch eine Abnahme der Instance-Leistung und -Reaktionszeit zu erkennen sind. Die optimale Anzahl der Benutzerverbindungen für Ihre DB-Instance ist von der Instance-Klasse und der Komplexität der ausgeführten Operationen abhängig. Um die Anzahl der Datenbankverbindungen zu bestimmen, ordnen Sie Ihre DB-Instance einer Parametergruppe zu, für die der Parameter User Connections auf einen anderen Wert als „0“ (unbegrenzt) gesetzt ist. Sie können eine entweder eine vorhandene Parametergruppe verwenden oder eine neue erstellen. Weitere Informationen finden Sie unter Parametergruppen für Amazon Aurora.

  • IOPSMetriken — Die erwarteten Werte für IOPS Messwerte hängen von der Festplattenspezifikation und der Serverkonfiguration ab. Verwenden Sie also Ihre Ausgangswerte, um herauszufinden, was typisch ist. Prüfen Sie, ob dauerhafte Abweichungen von den Werten Ihrer Ausgangsbasis vorliegen. Um eine optimale IOPS Leistung zu erzielen, sollten Sie sicherstellen, dass Ihr typisches Arbeitssatz in den Arbeitsspeicher passt, um Lese- und Schreibvorgänge zu minimieren.

Wenn die Leistung außerhalb der festgelegten Baseline liegt, müssen Sie möglicherweise Änderungen vornehmen, um die Datenbankverfügbarkeit für Ihre Workload zu optimieren. Beispielsweise müssen Sie möglicherweise die Instance-Klasse Ihrer DB-Instance ändern. Oder Sie müssen möglicherweise die Anzahl der DB-Instance und Read Replicas ändern, die für Clients verfügbar sind.