Überwachen von MSK Connect - Amazon Managed Streaming für Apache Kafka

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überwachen von MSK Connect

Die Überwachung ist ein wichtiger Bestandteil der Aufrechterhaltung der Zuverlässigkeit, Verfügbarkeit und Leistung von MSK Connect und Ihren anderen AWS Lösungen. Amazon CloudWatch überwacht Ihre AWS Ressourcen und die Anwendungen, auf denen Sie laufen, AWS in Echtzeit. Sie können Kennzahlen erfassen und verfolgen, benutzerdefinierte Dashboards erstellen und Alarme festlegen, die Sie benachrichtigen oder Maßnahmen ergreifen, wenn eine bestimmte Metrik einen von Ihnen festgelegten Schwellenwert erreicht. Sie können beispielsweise die CPU-Auslastung oder andere Messwerte Ihres Connectors CloudWatch verfolgen, sodass Sie dessen Kapazität bei Bedarf erhöhen können. Weitere Informationen finden Sie im CloudWatch Amazon-Benutzerhandbuch.

Sie können die folgenden API-Operationen verwenden:

  • DescribeConnectorOperation: Überwachen Sie den Status der Konnektor-Aktualisierungsvorgänge.

  • ListConnectorOperations: Verfolgen Sie frühere Updates, die auf Ihrem Connector ausgeführt wurden.

Die folgende Tabelle zeigt die Metriken, an die MSK Connect CloudWatch unter der ConnectorName Dimension sendet. MSK Connect liefert diese Metriken standardmäßig und ohne zusätzliche Kosten. CloudWatch speichert diese Metriken 15 Monate lang, sodass Sie auf historische Informationen zugreifen und sich einen besseren Überblick über die Leistung Ihrer Konnektoren verschaffen können. Sie können auch Alarme einrichten, die auf bestimmte Grenzwerte achten und Benachrichtigungen senden oder Aktivitäten auslösen, wenn diese Grenzwerte erreicht werden. Weitere Informationen finden Sie im CloudWatch Amazon-Benutzerhandbuch.

MSK-Connect-Metriken
Metrikname Beschreibung
BytesInPerSec Die Gesamtanzahl der vom Konnektor empfangenen Bytes.
BytesOutPerSec Die Gesamtanzahl der vom Konnektor bereitgestellten Bytes.
CpuUtilization Der prozentuale Anteil des CPU-Verbrauchs nach System und Benutzer.
ErroredTaskCount Die Anzahl von fehlerhaften Aufgaben.
MemoryUtilization Der Prozentsatz des Gesamtspeichers auf einer Worker-Instance, nicht nur der Heap-Speicher der Java Virtual Machine (JVM), der derzeit verwendet wird. JVM gibt normalerweise keinen Speicher an das Betriebssystem zurück. Daher beginnt die JVM-Heap-Größe (MemoryUtilization) normalerweise mit einer minimalen Heap-Größe, die schrittweise auf ein stabiles Maximum von etwa 80-90% ansteigt. Die JVM-Heap-Nutzung kann zunehmen oder abnehmen, wenn sich die tatsächliche Speicherauslastung des Konnektors ändert.
RebalanceCompletedTotal Die Gesamtzahl der von diesem Konnektor durchgeführten Neuausgleichungen.
RebalanceTimeAvg Die durchschnittliche Zeit in Millisekunden, die der Konnektor für den Neuausgleich benötigt.
RebalanceTimeMax Die maximale Zeit in Millisekunden, die der Konnektor für den Neuausgleich benötigt.
RebalanceTimeSinceLast

Die Zeit in Millisekunden, seit dieser Konnektor den letzten Neuausgleich abgeschlossen hat.

RunningTaskCount Die Anzahl der Aufgaben, die im Konnektor ausgeführt werden.
SinkRecordReadRate Die durchschnittliche Anzahl der pro Sekunde aus dem Apache-Kafka- oder Amazon-MSK-Cluster gelesenen Datensätze.
SinkRecordSendRate Die durchschnittliche Anzahl von Datensätzen pro Sekunde, die von den Transformationen ausgegeben und an das Ziel gesendet werden. Diese Zahl beinhaltet keine gefilterten Datensätze.
SourceRecordPollRate Die durchschnittliche Anzahl der pro Sekunde erstellten oder abgefragten Datensätze.
SourceRecordWriteRate Die durchschnittliche Anzahl pro Sekunde der von den Transformationen ausgegebenen und in den Apache-Kafka- oder Amazon-MSK-Cluster geschriebenen Datensätze.
TaskStartupAttemptsTotal Die Gesamtzahl der Aufgaben-Startups, die der Konnektor versucht hat. Sie können diese Metrik verwenden, um Anomalien bei Startup-Versuchen von Aufgaben zu identifizieren.
TaskStartupSuccessPercentage Der durchschnittliche Prozentsatz erfolgreicher Aufgaben-Startups für den Konnektor. Sie können diese Metrik verwenden, um Anomalien bei Startup-Versuchen von Aufgaben zu identifizieren.
WorkerCount Die Anzahl der Worker, die dem Konnektor zugewiesen sind.