

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Überwachen Sie einen von Amazon MSK bereitgestellten Cluster
<a name="monitoring"></a>

Es gibt mehrere Möglichkeiten, wie Amazon MSK Ihnen hilft, den Status Ihres von Amazon MSK bereitgestellten Clusters zu überwachen.
+ Amazon MSK sammelt Apache Kafka-Metriken und sendet sie an Amazon, CloudWatch wo Sie sie einsehen können. Weitere Informationen zu Apache-Kafka-Metriken, einschließlich derjenigen, die von Amazon MSK angezeigt werden, finden Sie unter [Überwachung](http://kafka.apache.org/documentation/#monitoring) in der Apache-Kafka-Dokumentation.
+ Sie können Ihren MSK-Cluster auch mit Prometheus, einer Open-Source-Überwachungsanwendung, überwachen. Weitere Informationen zu Prometheus finden Sie unter [Overview](https://prometheus.io/docs/introduction/overview/) in der Prometheus-Dokumentation. Informationen zur Überwachung Ihres von MSK bereitgestellten Clusters mit Prometheus finden Sie unter. [Überwachen Sie einen von MSK bereitgestellten Cluster mit Prometheus](open-monitoring.md)
+ (Nur Standardbroker) Amazon MSK unterstützt Sie bei der Überwachung Ihrer Festplattenspeicherkapazität, indem es Ihnen automatisch Warnmeldungen zur Speicherkapazität sendet, wenn ein bereitgestellter Cluster kurz davor ist, seine Speicherkapazitätsgrenze zu erreichen. Die Warnmeldungen enthalten auch Empfehlungen zu den besten Maßnahmen zur Behebung festgestellter Probleme. Auf diese Weise können Sie Festplattenkapazitätsprobleme erkennen und schnell beheben, bevor sie kritisch werden. Amazon MSK sendet diese Benachrichtigungen automatisch an die [Amazon MSK-Konsole](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/) Health Dashboard EventBridge, Amazon und E-Mail-Kontakte für Ihr AWS Konto. Weitere Informationen zu Warnmeldungen zur Speicherkapazität finden Sie unter [Verwenden Sie Amazon MSK-Speicherkapazitätswarnungen](cluster-alerts.md).

**Topics**
+ [

# Amazon MSK-Metriken anzeigen mit CloudWatch
](cloudwatch-metrics.md)
+ [

# Amazon MSK-Metriken zur Überwachung von Standard-Brokern mit CloudWatch
](metrics-details.md)
+ [

# Amazon MSK-Metriken zur Überwachung von Express-Brokern mit CloudWatch
](metrics-details-express.md)
+ [

# Überwachen Sie einen von MSK bereitgestellten Cluster mit Prometheus
](open-monitoring.md)
+ [

# Überwachen Sie die Verzögerungen bei den Verbrauchern
](consumer-lag.md)
+ [

# Verwenden Sie Amazon MSK-Speicherkapazitätswarnungen
](cluster-alerts.md)

# Amazon MSK-Metriken anzeigen mit CloudWatch
<a name="cloudwatch-metrics"></a>

Sie können Metriken für Amazon MSK über die CloudWatch Konsole, die Befehlszeile oder die CloudWatch API überwachen. Die folgenden Verfahren zeigen, wie Sie mithilfe dieser verschiedenen Verfahren auf die Metriken zugreifen können. 

**So greifen Sie über die Konsole auf Metriken zu CloudWatch**

Melden Sie sich bei der an AWS-Managementkonsole und öffnen Sie die CloudWatch Konsole unter [https://console.aws.amazon.com/cloudwatch/](https://console.aws.amazon.com/cloudwatch/).

1. Wählen Sie im Navigationsbereich **Metriken** aus.

1. Wählen Sie die Registerkarte **Alle Metriken** und dann **AWS/Kafka**.

1. Zum Anzeigen von allgemeinen Metriken auf Themenebene wählen Sie **Topic, Broker ID, Cluster Name (Thema, Broker-ID, Cluster-Name)**, für Metriken auf Broker-Ebene **Broker ID, Cluster Name (Broker-ID, Cluster-Name)** und für Metriken auf Cluster-Ebene **Cluster Name (Cluster-Name)** aus.

1. (Optional) Wählen Sie im Grafikbereich eine Statistik und einen Zeitraum aus, und erstellen Sie dann mit diesen Einstellungen einen CloudWatch Alarm.

**Um auf Metriken zuzugreifen, verwenden Sie AWS CLI**  
Verwenden Sie die [Listen-Metriken und [get-metric-statistics](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/get-metric-statistics.html)Befehle](https://docs.aws.amazon.com/cli/latest/reference/cloudwatch/list-metrics.html).

**So greifen Sie mit der CloudWatch CLI auf Metriken zu**  
Verwenden Sie die Befehle [mon-list-metrics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/cli/cli-mon-list-metrics.html) und [mon-get-stats](https://docs.aws.amazon.com/AmazonCloudWatch/latest/cli/cli-mon-get-stats.html).

**Um über die CloudWatch API auf Metriken zuzugreifen**  
Verwenden Sie die Operationen [ListMetrics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_ListMetrics.html) und [GetMetricStatistics](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_GetMetricStatistics.html).

# Amazon MSK-Metriken zur Überwachung von Standard-Brokern mit CloudWatch
<a name="metrics-details"></a>

Amazon MSK ist in Amazon integriert, CloudWatch sodass Sie CloudWatch Kennzahlen für Ihre MSK Standard-Broker sammeln, anzeigen und analysieren können. Die Metriken, die Sie für Ihre von MSK bereitgestellten Cluster konfigurieren, werden automatisch erfasst und in Intervallen von 1 CloudWatch Minute abgerufen. Sie können die Überwachungsebene für einen von MSK bereitgestellten Cluster auf eine der folgenden Optionen festlegen:`DEFAULT`,, `PER_BROKER` oder. `PER_TOPIC_PER_BROKER` `PER_TOPIC_PER_PARTITION` Die Tabellen im folgenden Abschnitt zeigen alle Metriken, die in jeder Überwachungsebene verfügbar sind.

**Anmerkung**  
Die Namen einiger Amazon MSK-Metriken für die CloudWatch Überwachung haben sich in Version 3.6.0 und höher geändert. Verwenden Sie die neuen Namen für die Überwachung dieser Metriken. Für Metriken mit geänderten Namen zeigt die nachfolgende Tabelle den Namen, der in Version 3.6.0 und höher verwendet wurde, gefolgt vom Namen in Version 2.8.2.tiered.

Metriken auf der `DEFAULT`-Ebene sind kostenlos. Die Preise für andere Kennzahlen sind auf der [ CloudWatchAmazon-Preisseite](https://aws.amazon.com/cloudwatch/pricing/) beschrieben.

## Überwachung auf `DEFAULT`-Ebene
<a name="default-metrics"></a>

Die in der folgenden Tabelle beschriebenen Metriken sind auf der `DEFAULT`-Überwachungsebene verfügbar. Sie sind kostenlos.


| Name | Wenn sichtbar | Dimensionen | Description | 
| --- | --- | --- | --- | 
| ActiveControllerCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Zu jeder Zeit sollte nur ein Controller pro Cluster aktiv sein. | 
| BurstBalance |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  |  Cluster-Name, Broker-ID  |  Der verbleibende Saldo der Eingabe-Ausgabe-Burst-Credits für EBS-Volumes im Cluster. Verwenden Sie dies, um Latenz oder verringerten Durchsatz zu untersuchen. `BurstBalance` wird für EBS-Volumes nicht berichtet, wenn die Basisleistung eines Volumes höher als die maximale Burst-Leistung ist. Weitere Informationen zur Funktionsweise von Burst-Gutschriften in finden Sie unter [I/O-Guthaben und Burst-Performance](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html#IOcredit).  | 
| BytesInPerSec | Nachdem Sie ein Thema erstellt haben. | Cluster-Name, Broker-ID, Thema | Die Anzahl der Bytes, die pro Sekunde von Clients empfangen werden. Diese Metrik ist pro Broker und auch pro Thema verfügbar. | 
| BytesOutPerSec | Nachdem Sie ein Thema erstellt haben. | Cluster-Name, Broker-ID, Thema | Die Anzahl der Bytes, die pro Sekunde an Clients gesendet werden. Diese Metrik ist pro Broker und auch pro Thema verfügbar. | 
| ClientConnectionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID, Client-Authentifizierung | Die Anzahl der aktiven authentifizierten Client-Verbindungen. | 
| ConnectionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Cluster-Name, Broker-ID  | Die Anzahl der aktiven authentifizierten und nicht authentifizierten Verbindungen sowie Verbindungen zwischen Brokern.  | 
| CPUCreditBalance  |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  |  Cluster-Name, Broker-ID  |  Die Anzahl verdienter CPU-Guthaben, die ein Broker angesammelt hat, seit er gestartet wurde. Guthaben werden auf dem Guthaben-Konto angesammelt, nachdem sie verdient wurden, und davon entfernt, wenn sie verbraucht werden. Wenn das CPU-Guthaben aufgebraucht ist, kann sich dies negativ auf die Leistung Ihres Clusters auswirken. Sie können Maßnahmen ergreifen, um die CPU-Last zu reduzieren. Sie können beispielsweise die Anzahl der Client-Anfragen reduzieren oder den Broker-Typ auf einen M5-Broker-Typ aktualisieren.  | 
| CpuIdle | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU-Leerlaufzeit. | 
| CpuIoWait | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Prozentsatz der CPU-Leerlaufzeit während eines ausstehenden Festplattenvorgangs. | 
| CpuSystem | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU im Kernel-Speicher. | 
| CpuUser | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU im Benutzerbereich. | 
| GlobalPartitionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Die Anzahl der Partitionen für alle Themen im Cluster, ausgenommen Replikate. Da GlobalPartitionCount keine Replikate enthalten sind, kann die Summe der PartitionCount Werte höher sein, als GlobalPartitionCount wenn der Replikationsfaktor für ein Thema größer als 1 ist. | 
| GlobalTopicCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Gesamtzahl der Themen für alle Broker im Cluster. | 
| EstimatedMaxTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Cluster-Name, Verbrauchergruppe, Thema | Voraussichtlicher Zeitaufwand (in Sekunden) bis zur Entleerung von MaxOffsetLag. | 
| KafkaAppLogsDiskUsed | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil des Festplattenspeichers, der für Anwendungsprotokolle verwendet wird. | 
| KafkaDataLogsDiskUsed (Cluster Name, Broker ID-Dimension) | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil des Festplattenspeichers, der für Datenprotokolle verwendet wird. | 
| LeaderCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Gesamtzahl der Partitionsleiter pro Broker, ohne Replikate. | 
| MaxOffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Cluster-Name, Verbrauchergruppe, Thema | Die maximale Offset-Verzögerung für alle Partitionen in einem Thema. | 
| MemoryBuffered | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des gepufferten Arbeitsspeichers in Bytes für den Broker. | 
| MemoryCached | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des zwischengespeicherten Arbeitsspeichers in Bytes für den Broker. | 
| MemoryFree | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Arbeitsspeichergröße in Byte, die frei und für den Broker verfügbar ist. | 
| HeapMemoryAfterGC  |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  |  Cluster-Name, Broker-ID  | Der Prozentsatz des gesamten Heap-Speichers, der nach der Garbage Collection verwendet wird. | 
| MemoryUsed | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des Arbeitsspeichers in Byte, der für den Broker verwendet wird. | 
| MessagesInPerSec | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Nachrichten, die pro Sekunde für den Broker eingehen. | 
| NetworkRxDropped | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der gelöschten Empfangspakete. | 
| NetworkRxErrors | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Netzwerkempfangsfehler für den Broker. | 
| NetworkRxPackets | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der vom Broker empfangenen Pakete. | 
| NetworkTxDropped | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der gelöschten Übertragungspakete. | 
| NetworkTxErrors | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Netzwerkübertragungsfehler für den Broker. | 
| NetworkTxPackets | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der vom Broker übertragenen Pakete. | 
| OfflinePartitionsCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Die Gesamtzahl der Partitionen, die im Cluster offline sind. | 
| PartitionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Gesamtzahl der Themenpartitionen pro Broker, einschließlich Replikate. | 
| ProduceTotalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die mittlere Erzeugungszeit in Millisekunden. | 
| RequestBytesMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die mittlere Anzahl der Anforderungs-Bytes für den Broker. | 
| RequestTime | Nachdem die Anforderungsablehnung angewendet wurde. | Cluster-Name, Broker-ID | Die durchschnittliche Zeit (in Millisekunden) für die Verarbeitung von Anforderungen in Broker-Netzwerk- und E/A-Threads. | 
| RootDiskUsed | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der vom Broker verwendeten Stamm-Datenträger. | 
| RollingEstimatedTimeLagMax\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Cluster-Name, Verbrauchergruppe, Thema | Schätzung der geschätzten maximalen Zeit (in Sekunden), um die Verzögerung beim Partitionsoffset für alle Partitionen in einem Thema zu verringern. | 
| SumOffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Cluster-Name, Verbrauchergruppe, Thema | Die aggregierte Offset-Verzögerung für alle Partitionen in einem Thema. | 
| SwapFree | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des für den Broker verfügbaren Auslagerungsspeichers in Bytes. | 
| SwapUsed  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des Auslagerungsspeichers in Bytes, der für den Broker verwendet wird. | 
| TrafficShaping  |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  |  Cluster-Name, Broker-ID  |  Allgemeine Metriken, die die Anzahl der Pakete angeben, die aufgrund von Überschreitungen der Netzwerkzuweisungen geformt (verworfen oder in die Warteschlange gestellt) wurden. Genauere Details sind mit PER\$1BROKER-Metriken verfügbar.  | 
| UnderMinIsrPartitionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der „under minIsr“-Partitionen für den Broker. | 
| UnderReplicatedPartitions | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der nicht replizierten Partitionen für den Broker. | 
| UserPartitionExists | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Eine boolesche Metrik, die das Vorhandensein einer benutzereigenen Partition auf einem Broker angibt. Ein Wert von 1 gibt an, dass auf dem Broker Partitionen vorhanden sind. | 
| ZooKeeperRequestLatencyMsMean  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Für einen ZooKeeper basierten Cluster. Die durchschnittliche Latenz in Millisekunden für ZooKeeper Apache-Anfragen vom Broker. | 
| ZooKeeperSessionState | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Für ZooKeeper einen basierten Cluster. Verbindungsstatus der ZooKeeper Brokersitzung, der einer der folgenden sein kann: NOT\$1CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH\$1FAILED: '10.0'. | 

\$1 Bei Kennzahlen zur Verzögerung der Verbraucher sind ausschließlich ASCII-Namen für Verbrauchergruppen erforderlich und es gelten spezifische Emissionsanforderungen. Weitere Informationen finden Sie unter [Überwachen Sie die Verzögerungen bei den Verbrauchern](consumer-lag.md).

## Überwachung auf `PER_BROKER`-Ebene
<a name="broker-metrics"></a>

Wenn Sie die Überwachungsebene auf „`PER_BROKER`“ festlegen, erhalten Sie die in der folgenden Tabelle beschriebenen Metriken zusätzlich zu allen `DEFAULT`-Ebenenmetriken. Sie zahlen für die Metriken in der folgenden Tabelle. Die `DEFAULT`-Ebenenmetriken sind allerdings weiterhin kostenlos. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Clustername, Broker-ID.


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| BwInAllowanceExceeded | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Pakete, die geformt wurden, weil die eingehende aggregierte Bandbreite das Maximum für den Broker überschritten hat.  | 
| BwOutAllowanceExceeded | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Pakete, die geformt wurden, weil die ausgehende aggregierte Bandbreite das Maximum für den Broker überschritten hat.  | 
| ConntrackAllowanceExceeded  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Pakete, die geformt wurden, weil die Verbindungs-Nachverfolgung das Maximum für den Broker überschritten hat. Die Verbindungs-Nachverfolgung is mit Sicherheitsgruppen verbunden, die jede aufgebaute Verbindung nachverfolgen, um sicherzustellen, dass Retour-Pakete wie erwartet bereitgestellt werden.   | 
| ConnectionCloseRate | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der pro Sekunde und Listener geschlossenen Verbindungen. Diese Zahl wird pro Listener aggregiert und nach den Client-Listenern gefiltert.  | 
| ConnectionCreationRate | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der neuen Verbindungen, die pro Sekunde und Listener hergestellt werden. Diese Zahl wird pro Listener aggregiert und nach den Client-Listenern gefiltert.  | 
| CpuCreditUsage | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Das vom Broker verbrauchte CPU-Guthaben. Wenn das CPU-Guthaben aufgebraucht ist, kann sich dies negativ auf die Leistung Ihres Clusters auswirken. Sie können Maßnahmen ergreifen, um die CPU-Last zu reduzieren. Sie können beispielsweise die Anzahl der Client-Anfragen reduzieren oder den Broker-Typ auf einen M5-Broker-Typ aktualisieren.  | 
| FetchConsumerLocalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die die Konsumentenanforderung beim Leader verarbeitet wird. | 
| FetchConsumerRequestQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Konsumentenanforderung in der Anforderungswarteschlange befindet. | 
| FetchConsumerResponseQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Konsumentenanforderung in der Antwortwarteschlange befindet. | 
| FetchConsumerResponseSendTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden in der der Verbraucher eine Antwort sendet. | 
| FetchConsumerTotalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Gesamtzeit in Millisekunden, die Konsumenten für das Abrufen von Daten vom Broker benötigen. | 
| FetchFollowerLocalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, in der die Follower-Anforderung beim Leader verarbeitet wird. | 
| FetchFollowerRequestQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Follower-Anforderung in der Anforderungswarteschlange befindet. | 
| FetchFollowerResponseQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Follower-Anforderung in der Antwortwarteschlange befindet. | 
| FetchFollowerResponseSendTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, in der der Follower eine Antwort sendet. | 
| FetchFollowerTotalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Gesamtzeit in Millisekunden, die Follower für das Abrufen von Daten vom Broker benötigen. | 
| FetchMessageConversionsPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Abrufnachrichtenkonvertierungen pro Sekunde für den Broker. | 
| FetchThrottleByteRate | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der gedrosselten Bytes pro Sekunde. | 
| FetchThrottleQueueSize | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| FetchThrottleTime | Nachdem die Bandbreitenablehnung angewendet wurde. | Die durchschnittliche Abrufdrosselzeit in Millisekunden. | 
| IAMNumberOfConnectionRequests | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der IAM-Authentifizierungsanfragen pro Sekunde. | 
| IAMTooManyConnections | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der versuchten Verbindungen liegt über 100. 0 bedeutet, dass die Anzahl der Verbindungen innerhalb des Grenzwerts liegt. Wenn >0, wird die Drosselungsgrenze überschritten und Sie müssen die Anzahl der Verbindungen reduzieren. | 
| LinklocalAllowanceExceeded  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der verworfenen Pakete, weil das PPS des Datenverkehrs zu lokalen Proxy-Diensten das Maximum für die Netzwerkschnittstelle überschritten hat. Dies wirkt sich auf den Datenverkehr zum DNS-Dienst, zum Instance Metadata Service und zum Amazon Time Sync Service aus.  | 
| NetworkProcessorAvgIdlePercent | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Der durchschnittliche Anteil der Zeit, die sich die Netzwerkprozessoren im Leerlauf befinden. | 
| PpsAllowanceExceeded | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Pakete, die geformt wurden, weil die bidirektionale PPS das Maximum für den Broker überschritten hat.  | 
| ProduceLocalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die durchschnittliche Zeit in Millisekunden, in der die Anfrage beim Leader verarbeitet wird. | 
| ProduceMessageConversionsPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Erzeugnisnachrichtenkonvertierungen pro Sekunde für den Broker. | 
| ProduceMessageConversionsTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden für Nachrichtenformatkonvertierungen. | 
| ProduceRequestQueueTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden, die sich Anforderungsnachrichten in der Warteschlange befinden. | 
| ProduceResponseQueueTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden, die sich Antwortnachrichten in der Warteschlange befinden. | 
| ProduceResponseSendTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden für das Senden von Antwortnachrichten. | 
| ProduceThrottleByteRate | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der gedrosselten Bytes pro Sekunde. | 
| ProduceThrottleQueueSize | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| ProduceThrottleTime | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Durchschnittszeit der Erzeugungsdrosselung in Millisekunden. | 
| ProduceTotalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Erzeugungszeit in Millisekunden. | 
|  `RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)`  |  Nachdem ein Produzent/Verbraucher vorhanden ist.  |  Die Gesamtzahl der Byte, die als Reaktion auf Verbraucher-Abrufe aus dem gestaffelten Speicher übertragen wurden. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik.  | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) |  Nachdem ein Produzent/Verbraucher vorhanden ist.  |  Die Gesamtzahl der in den gestaffelten Speicher übertragenen Byte, einschließlich Daten aus Protokollsegmenten, Indizes und anderen Hilfsdateien. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik.  | 
| RemoteLogManagerTasksAvgIdlePercent |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Der durchschnittliche Prozentsatz der Zeit, die der Remote-Protokoll-Manager im Leerlauf verbracht hat. Der Remote Log Manager überträgt Daten vom Broker in einen gestaffelten Speicher. Kategorie: Interne Aktivität. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteLogReaderAvgIdlePercent |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Der durchschnittliche Prozentsatz der Zeit, die der Remote-Protokollleser im Leerlauf verbracht hat. Der Remote-Protokollleser überträgt Daten vom Remote-Speicher an den Broker als Reaktion auf Verbraucher-Abrufe. Kategorie: Interne Aktivität. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteLogReaderTaskQueueSize |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Die Anzahl der Aufgaben, die für Lesevorgänge aus dem gestaffelten Speicher verantwortlich sind und darauf warten, geplant zu werden. Kategorie: Interne Aktivität. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Die Gesamtfehlerrate bei der Beantwortung von Leseanforderungen, die der angegebene Broker an den gestaffelten Speicher gesendet hat, um Daten als Antwort auf Benutzerabrufe abzurufen. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Die Gesamtzahl der Leseanforderungen, die der angegebene Broker an den gestaffelten Speicher gesendet hat, um Daten als Antwort auf Benutzerabrufe abzurufen. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) |  Nachdem der Cluster den Status „ACTIVE“ erreicht hat.  | Die Gesamtfehlerrate als Antwort auf Schreibanforderungen, die der angegebene Broker zur Übertragung von vorgelagerten Daten an den gestaffelten Speicher gesendet hat. Diese Metrik umfasst alle Themenpartitionen, die zum vorgelagerten Transfer-Datenverkehr beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteLogSizeBytes | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der auf der Remoteebene gespeicherten Byte. Diese Metrik ist für Tiered Storage-Cluster ab Apache Kafka Version 3.7.x auf Amazon MSK verfügbar.  | 
| ReplicationBytesInPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Bytes, die pro Sekunde von anderen Brokern empfangen werden. | 
| ReplicationBytesOutPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Bytes, die pro Sekunde an andere Broker gesendet werden. | 
| RequestExemptFromThrottleTime | Nachdem die Anforderungsablehnung angewendet wurde. | Die durchschnittliche Zeit (in Millisekunden) für die Verarbeitung der von der Drosselung ausgenommenen Anforderungen in Broker-Netzwerk- und E/A-Threads. | 
| RequestHandlerAvgIdlePercent | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Der durchschnittliche Anteil der Zeit, die sich die Request-Handler-Threads im Leerlauf befinden. | 
| RequestThrottleQueueSize | Nachdem die Anforderungsablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| RequestThrottleTime | Nachdem die Anforderungsablehnung angewendet wurde. | Die Durchschnittszeit der Anforderungsdrosselung in Millisekunden. | 
| TcpConnections | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Zeigt die Anzahl der eingehenden und ausgehenden TCP-Segmente an, für die das SYN-Flag gesetzt ist.  | 
| RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) | Nachdem Sie ein Thema erstellt haben. | Die Gesamtzahl der Bytes der Daten, die für die gestaffelte Speicherung auf dem Broker in Frage kommen, aber noch nicht in den gestaffelten Speicher übertragen wurden. Diese Metriken zeigen die Effizienz der vorgelagerten Datenübertragung. Mit zunehmender Verzögerung nimmt die Datenmenge zu, die nicht im gestaffelten Speicher gespeichert wird. Kategorie: Archiv-Verzögerung. Dies ist keine KIP-405-Metrik. | 
| TrafficBytes | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Zeigt den Netzwerkverkehr in Gesamtbytes zwischen Clients (Produzenten und Verbrauchern) und Brokern an. Der Verkehr zwischen Brokern wird nicht berichtet.  | 
| VolumeQueueLength | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl von Anfragen für Lese- und Schreibvorgänge, die innerhalb eines bestimmten Zeitraums auf Abschluss warten.  | 
|  VolumeReadBytes  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Bytes, die in einem angegebenen Zeitraum gelesen wurden.  | 
| VolumeReadOps  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Lesevorgänge in einem angegebenen Zeitraum.  | 
| VolumeTotalReadTime  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Gesamtzahl von Sekunden, die von allen innerhalb eines bestimmten Zeitraums abgeschlossenen Lesevorgängen aufgewendet wurden.  | 
| VolumeTotalWriteTime  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Gesamtzahl von Sekunden, die von allen innerhalb eines bestimmten Zeitraums abgeschlossenen Schreiboperationen aufgewendet wurden.  | 
| VolumeWriteBytes  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Anzahl der Bytes, die in einem angegebenen Zeitraum geschrieben wurden.  | 
| VolumeWriteOps  | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. |  Die Gesamtzahl der Schreibvorgänge in einem angegebenen Zeitraum.  | 

## Überwachung auf `PER_TOPIC_PER_BROKER`-Ebene
<a name="broker-topic-metrics"></a>

Wenn Sie die Überwachungsebene auf `PER_TOPIC_PER_BROKER` festlegen, erhalten Sie zusätzlich zu allen in der folgenden Tablette beschriebenen Metriken alle Metriken aus den `PER_BROKER` und DEFAULT-Ebenen. Nur die `DEFAULT`-Ebenenmetriken sind kostenlos. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Clustername, Broker-ID, Thema.

**Wichtig**  
Für einen Amazon-MSK-Cluster, der Apache Kafka 2.4.1 oder eine neuere Version verwendet, werden die Metriken in der folgenden Tabelle erst angezeigt, nachdem ihre Werte zum ersten Mal ungleich Null sind. Produzenten müssen beispielsweise zuerst Daten an den Cluster senden, um `BytesInPerSec` anzuzeigen. 


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| FetchMessageConversionsPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der abrufenden Nachrichten, die pro Sekunde konvertiert werden. | 
| MessagesInPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Nachrichten, die pro Sekunde empfangen werden. | 
| ProduceMessageConversionsPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Konvertierungen pro Sekunde für produzierte Nachrichten. | 
| RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered) |  Nachdem Sie ein Thema erstellt haben und das Thema produziert/verbraucht.  |  Die Gesamtzahl der Bytes, die für das angegebene Thema und den angegebenen Broker als Reaktion auf Verbraucher-Abrufe aus dem gestaffelten Speicher übertragen wurden. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr für den angegebenen Broker beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik.  | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) | Nachdem Sie ein Thema erstellt haben und das Thema produziert/verbraucht. |  Die Anzahl der Bytes, die für das angegebene Thema und den angegebenen Broker in den gestaffelten Speicher übertragen wurden. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr für den angegebenen Broker beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik.  | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) | Nachdem Sie ein Thema erstellt haben und das Thema produziert/verbraucht. | Die Fehlerrate bei der Beantwortung von Leseanforderungen, die der angegebene Broker an den gestaffelten Speicher sendet, um Daten als Antwort auf Benutzerabrufe zum angegebenen Thema abzurufen. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr für den angegebenen Broker beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) | Nachdem Sie ein Thema erstellt haben und das Thema produziert/verbraucht. | Die Anzahl der Leseanforderungen, die der angegebene Broker an den gestaffelten Speicher sendet, um Daten als Antwort auf Benutzerabrufe zum angegebenen Thema abzurufen. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr für den angegebenen Broker beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) | Nachdem Sie ein Thema erstellt haben und das Thema produziert/verbraucht. | Die Fehlerrate bei der Beantwortung von Schreibanforderungen, die der angegebene Broker an den gestaffelten Speicher sendet, um Daten in den vorgelagerten Bereich zu übertragen. Diese Metrik umfasst alle Themenpartitionen, die zum nachgelagerten Transfer-Datenverkehr für den angegebenen Broker beitragen. Kategorie: Datenverkehr und Fehlerquoten. Dies ist eine [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage)-Metrik. | 
| RemoteLogSizeBytes | Nachdem Sie ein Thema erstellt haben. |  Die Anzahl der auf der Remote-Tier gespeicherten Byte. Diese Metrik ist für Tiered Storage-Cluster ab Apache Kafka Version 3.7.x auf Amazon MSK verfügbar.  | 

## Überwachung auf `PER_TOPIC_PER_PARTITION`-Ebene
<a name="topic-partition-metrics"></a>

Wenn Sie die Überwachungsebene auf `PER_TOPIC_PER_PARTITION` festlegen, erhalten Sie zusätzlich zu allen in der folgenden Tablette beschriebenen Metriken alle Metriken aus den `PER_TOPIC_PER_BROKER`-, `PER_BROKER`- und DEFAULT-Ebenen. Nur die `DEFAULT`-Ebenenmetriken sind kostenlos. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Verbrauchergruppe, Thema, Partition.


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| EstimatedTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Geschätzte Zeit (in Sekunden), um die Verzögerung beim Partitions-Offset zu verringern. | 
| OffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbraucher-Verzögerung auf Partitionsebene als Anzahl von Offsets. | 
| RollingEstimatedTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Schätzung der Rolling-Zeit (in Sekunden), um die Verzögerung beim Partitions-Offset zu verringern. | 

\$1 Bei Kennzahlen zur Verzögerung von Verbrauchern sind nur ASCII-Namen für Verbrauchergruppen erforderlich und es gelten spezifische Emissionsanforderungen. Weitere Informationen finden Sie unter [Überwachen Sie die Verzögerungen bei den Verbrauchern](consumer-lag.md).

# Verstehen Sie die Status des MSK Provisioned Clusters
<a name="msk-cluster-states"></a>

Die folgende Tabelle zeigt die möglichen Status eines von MSK bereitgestellten Clusters und beschreibt, was sie bedeuten. Sofern nicht anders angegeben, gelten die Status des bereitgestellten MSK-Clusters sowohl für den Brokertyp Standard als auch für den Express-Brokertyp. In dieser Tabelle wird auch beschrieben, welche Aktionen Sie ausführen können und welche nicht, wenn sich ein von MSK bereitgestellter Cluster in einem dieser Zustände befindet. Um den Status eines Clusters herauszufinden, können Sie die AWS-Managementkonsole aufrufen. Sie können auch den Befehl [describe-cluster-v2](https://awscli.amazonaws.com/v2/documentation/api/latest/reference/kafka/describe-cluster-v2.html) oder die Operation [DescribeClusterV2](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters-clusterarn.html#DescribeClusterV2) verwenden, um den bereitgestellten Cluster zu beschreiben. Die Beschreibung eines Clusters beinhaltet seinen Status.


****  

| MSK: Status des bereitgestellten Clusters | Bedeutung und mögliche Aktionen | 
| --- | --- | 
| ACTIVE |  Sie können Daten produzieren und verbrauchen. Sie können auch Amazon MSK API und AWS CLI Operationen auf dem Cluster ausführen.  | 
| WIRD ERSTELLT |  Amazon MSK richtet den bereitgestellten Cluster ein. Sie müssen warten, bis der Cluster den Status ACTIVE erreicht hat, bevor Sie ihn zur Erzeugung oder Nutzung von Daten oder zur Ausführung der Amazon MSK-API oder AWS CLI -Operationen verwenden können.  | 
| WIRD GELÖSCHT | Der bereitgestellte Cluster wird gelöscht. Sie können ihn nicht verwenden, um Daten zu erzeugen oder zu verbrauchen. Sie können auch keine Amazon MSK-API oder AWS CLI Operationen darauf ausführen. | 
| FEHLGESCHLAGEN | Der Prozess zur Erstellung oder Löschung des bereitgestellten Clusters ist fehlgeschlagen. Sie können den Cluster nicht zum Erstellen oder Verbrauchen von Daten verwenden. Sie können den Cluster löschen, aber keine Amazon MSK-API oder AWS CLI Aktualisierungsvorgänge darauf ausführen. | 
| HEALING |  Amazon MSK führt einen internen Vorgang durch, z. B. den Austausch eines fehlerhaften Brokers. Beispielsweise reagiert der Broker möglicherweise nicht. Sie können den bereitgestellten Cluster weiterhin verwenden, um Daten zu erzeugen und zu nutzen. Sie können jedoch keine Amazon MSK-API- oder AWS CLI Aktualisierungsvorgänge auf dem Cluster ausführen, bis er wieder in den Status ACTIVE zurückkehrt.  | 
| MAINTENANCE | (Nur Standardbroker) Amazon MSK führt routinemäßige Wartungsarbeiten am Cluster durch. Zu diesen Wartungsvorgängen gehören auch Sicherheitspatches. Sie können den Cluster immer noch zum Erstellen oder Verbrauchen von Daten verwenden. Sie können jedoch keine Amazon MSK-API- oder AWS CLI-Aktualisierungsvorgänge für den Cluster ausführen, bis er wieder in den Status ACTIVE zurückkehrt. Der Cluster-Status bleibt während der Wartung auf Express-Brokern AKTIV. Siehe [Patchen auf von MSK bereitgestellten Clustern](patching-impact.md). | 
| REBOOTING\$1BROKER | Amazon MSK startet einen Broker neu. Sie können den bereitgestellten Cluster weiterhin verwenden, um Daten zu erzeugen und zu nutzen. Sie können jedoch keine Amazon MSK-API- oder AWS CLI Aktualisierungsvorgänge auf dem Cluster ausführen, bis er wieder in den Status ACTIVE zurückkehrt. | 
| WIRD AKTUALISIERT | Eine vom Benutzer initiierte Amazon MSK-API oder ein AWS CLI Vorgang aktualisiert den bereitgestellten Cluster. Sie können den bereitgestellten Cluster weiterhin verwenden, um Daten zu erzeugen und zu nutzen. Sie können jedoch keine weiteren Amazon MSK-API- oder AWS CLI Aktualisierungsvorgänge für den Cluster ausführen, bis er wieder in den Status ACTIVE zurückkehrt. | 

# Amazon MSK-Metriken zur Überwachung von Express-Brokern mit CloudWatch
<a name="metrics-details-express"></a>

Amazon MSK lässt sich integrieren, CloudWatch sodass Sie CloudWatch Kennzahlen für Ihre MSK Express-Broker sammeln, anzeigen und analysieren können. Die Metriken, die Sie für Ihre von MSK bereitgestellten Cluster konfigurieren, werden automatisch erfasst und in Intervallen von 1 CloudWatch Minute abgerufen. Sie können die Überwachungsebene für einen von MSK bereitgestellten Cluster auf eine der folgenden Optionen festlegen:`DEFAULT`,, `PER_BROKER` oder. `PER_TOPIC_PER_BROKER` `PER_TOPIC_PER_PARTITION` Die Tabellen in den folgenden Abschnitten zeigen die Metriken, die ab jeder Überwachungsebene verfügbar sind.

Metriken auf der `DEFAULT`-Ebene sind kostenlos. Die Preise für andere Kennzahlen sind auf der [ CloudWatchAmazon-Preisseite](https://aws.amazon.com/cloudwatch/pricing/) beschrieben.

## `DEFAULT`Füllstandskontrolle für Express-Broker
<a name="express-default-metrics"></a>

Die in der folgenden Tabelle beschriebenen Kennzahlen sind auf `DEFAULT` Überwachungsebene kostenlos verfügbar.


| Name | Wenn sichtbar | Dimensionen | Description | 
| --- | --- | --- | --- | 
| ActiveControllerCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Zu jeder Zeit sollte nur ein Controller pro Cluster aktiv sein. | 
| BytesInPerSec | Nachdem Sie ein Thema erstellt haben. | Cluster-Name, Broker-ID, Thema | Die Anzahl der Bytes, die pro Sekunde von Clients empfangen werden. Diese Metrik ist pro Broker und auch pro Thema verfügbar. | 
| BytesOutPerSec | Nachdem Sie ein Thema erstellt haben. | Cluster-Name, Broker-ID, Thema | Die Anzahl der Bytes, die pro Sekunde an Clients gesendet werden. Diese Metrik ist pro Broker und auch pro Thema verfügbar. | 
| ClientConnectionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID, Client-Authentifizierung | Die Anzahl der aktiven authentifizierten Client-Verbindungen. | 
| ConnectionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der aktiven authentifizierten und nicht authentifizierten Verbindungen sowie Verbindungen zwischen Brokern. | 
| CpuIdle | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU-Leerlaufzeit. | 
| CpuSystem | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU im Kernel-Speicher. | 
| CpuUser | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Der Anteil der CPU im Benutzerbereich. | 
| GlobalPartitionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Die Anzahl der Partitionen für alle Themen im Cluster, ausgenommen Replikate. Da `GlobalPartitionCount` keine Replikate enthalten sind, kann die Summe der `PartitionCount` Werte höher sein, als `GlobalPartitionCount` wenn der Replikationsfaktor für ein Thema größer als `1` ist. | 
| GlobalTopicCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Gesamtzahl der Themen für alle Broker im Cluster. | 
| EstimatedMaxTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbrauchergruppe, Thema | Voraussichtlicher Zeitaufwand (in Sekunden) bis zur Entleerung von `MaxOffsetLag`. | 
| LeaderCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Gesamtzahl der Partitionsleiter pro Broker, ohne Replikate. | 
| MaxOffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbrauchergruppe, Thema | Die maximale Offset-Verzögerung für alle Partitionen in einem Thema. | 
| MemoryBuffered | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des gepufferten Arbeitsspeichers in Bytes für den Broker. | 
| MemoryCached | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des zwischengespeicherten Arbeitsspeichers in Bytes für den Broker. | 
| MemoryFree | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Arbeitsspeichergröße in Byte, die frei und für den Broker verfügbar ist. | 
| MemoryUsed | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Größe des Arbeitsspeichers in Byte, der für den Broker verwendet wird. | 
| MessagesInPerSec | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Nachrichten, die pro Sekunde für den Broker eingehen. | 
| NetworkRxDropped | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der gelöschten Empfangspakete. | 
| NetworkRxErrors | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Netzwerkempfangsfehler für den Broker. | 
| NetworkRxPackets | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der vom Broker empfangenen Pakete. | 
| NetworkTxDropped | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der gelöschten Übertragungspakete. | 
| NetworkTxErrors | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der Netzwerkübertragungsfehler für den Broker. | 
| NetworkTxPackets | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Anzahl der vom Broker übertragenen Pakete. | 
| PartitionCount | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die Gesamtzahl der Themenpartitionen pro Broker, einschließlich Replikate. | 
| ProduceTotalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die mittlere Erzeugungszeit in Millisekunden. | 
| RequestBytesMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Die mittlere Anzahl der Anforderungs-Bytes für den Broker. | 
| RequestTime | Nachdem die Anforderungsablehnung angewendet wurde. | Cluster-Name, Broker-ID | Die durchschnittliche Zeit in Millisekunden, die im Broker-Netzwerk und in I/O Threads zur Bearbeitung von Anfragen aufgewendet wurde. | 
| RollingEstimatedTimeLagMax\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbrauchergruppe, Thema | Schätzung der maximalen Zeit (in Sekunden), um die Verzögerung beim Partitionsoffset für alle Partitionen in einem Thema zu verringern. | 
| StorageUsed | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name | Der gesamte Speicherplatz, der von allen Partitionen im Cluster verwendet wird, ausgenommen Replikate. | 
| SumOffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbrauchergruppe, Thema | Die aggregierte Offset-Verzögerung für alle Partitionen in einem Thema. | 
| UserPartitionExists | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Cluster-Name, Broker-ID | Boolesche Metrik, die das Vorhandensein einer benutzereigenen Partition auf einem Broker angibt. Ein Wert von 1 gibt an, dass auf dem Broker Partitionen vorhanden sind. | 

\$1 Bei Kennzahlen zur Verzögerung von Verbrauchern sind nur ASCII-Namen für Verbrauchergruppen erforderlich und es gelten spezifische Emissionsanforderungen. Weitere Informationen finden Sie unter [Überwachen Sie die Verzögerungen bei den Verbrauchern](consumer-lag.md).

## `PER_BROKER`Füllstandskontrolle für Express-Broker
<a name="express-per-broker-metrics"></a>

Wenn Sie die Überwachungsebene auf „`PER_BROKER`“ festlegen, erhalten Sie die in der folgenden Tabelle beschriebenen Metriken zusätzlich zu allen `DEFAULT`-Ebenenmetriken. Sie zahlen für die Metriken in der folgenden Tabelle, wohingegen die `DEFAULT` Level-Metriken weiterhin kostenlos sind. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Clustername, Broker-ID.


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| ConnectionCloseRate | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der pro Sekunde und Listener geschlossenen Verbindungen. Diese Zahl wird pro Listener aggregiert und nach den Client-Listenern gefiltert. | 
| ConnectionCreationRate | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der neuen Verbindungen, die pro Sekunde und Listener hergestellt werden. Diese Zahl wird pro Listener aggregiert und nach den Client-Listenern gefiltert. | 
| FetchConsumerLocalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die die Konsumentenanforderung beim Leader verarbeitet wird. | 
| FetchConsumerRequestQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Konsumentenanforderung in der Anforderungswarteschlange befindet. | 
| FetchConsumerResponseQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Konsumentenanforderung in der Antwortwarteschlange befindet. | 
| FetchConsumerResponseSendTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden in der der Verbraucher eine Antwort sendet. | 
| FetchConsumerTotalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Gesamtzeit in Millisekunden, die Konsumenten für das Abrufen von Daten vom Broker benötigen. | 
| FetchFollowerLocalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, in der die Follower-Anforderung beim Leader verarbeitet wird. | 
| FetchFollowerRequestQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Follower-Anforderung in der Anforderungswarteschlange befindet. | 
| FetchFollowerResponseQueueTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, die sich die Follower-Anforderung in der Antwortwarteschlange befindet. | 
| FetchFollowerResponseSendTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Zeit in Millisekunden, in der der Follower eine Antwort sendet. | 
| FetchFollowerTotalTimeMsMean | Nachdem ein Produzent/Konsument vorhanden ist. | Die mittlere Gesamtzeit in Millisekunden, die Follower für das Abrufen von Daten vom Broker benötigen. | 
| FetchThrottleByteRate | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der gedrosselten Bytes pro Sekunde. | 
| FetchThrottleQueueSize | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| FetchThrottleTime | Nachdem die Bandbreitenablehnung angewendet wurde. | Die durchschnittliche Abrufdrosselzeit in Millisekunden. | 
| IAMNumberOfConnectionRequests | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der IAM-Authentifizierungsanfragen pro Sekunde. | 
| IAMTooManyConnections | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die Anzahl der versuchten Verbindungen liegt über 100. `0`bedeutet, dass die Anzahl der Verbindungen innerhalb des Grenzwerts liegt. Wenn `>0` die Drosselungsgrenze überschritten wird und Sie die Anzahl der Verbindungen reduzieren müssen. | 
| NetworkProcessorAvgIdlePercent | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Der durchschnittliche Anteil der Zeit, die sich die Netzwerkprozessoren im Leerlauf befinden. | 
| ProduceLocalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die durchschnittliche Zeit in Millisekunden, in der die Anfrage beim Leader verarbeitet wird. | 
| ProduceRequestQueueTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden, die sich Anforderungsnachrichten in der Warteschlange befinden. | 
| ProduceResponseQueueTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden, die sich Antwortnachrichten in der Warteschlange befinden. | 
| ProduceResponseSendTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Zeit in Millisekunden für das Senden von Antwortnachrichten. | 
| ProduceThrottleByteRate | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der gedrosselten Bytes pro Sekunde. | 
| ProduceThrottleQueueSize | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| ProduceThrottleTime | Nachdem die Bandbreitenablehnung angewendet wurde. | Die Durchschnittszeit der Erzeugungsdrosselung in Millisekunden. | 
| ProduceTotalTimeMsMean | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Die mittlere Erzeugungszeit in Millisekunden. | 
| ReplicationBytesInPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Bytes, die pro Sekunde von anderen Brokern empfangen werden. | 
| ReplicationBytesOutPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Bytes, die pro Sekunde an andere Broker gesendet werden. | 
| RequestExemptFromThrottleTime | Nachdem die Anforderungsablehnung angewendet wurde. | Die durchschnittliche Zeit in Millisekunden, die im Broker-Netzwerk und in I/O Threads für die Verarbeitung von Anfragen aufgewendet wird, für die keine Drosselung gilt. | 
| RequestHandlerAvgIdlePercent | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Der durchschnittliche Anteil der Zeit, die sich die Request-Handler-Threads im Leerlauf befinden. | 
| RequestThrottleQueueSize | Nachdem die Anforderungsablehnung angewendet wurde. | Die Anzahl der Nachrichten in der Drosselungswarteschlange. | 
| RequestThrottleTime | Nachdem die Anforderungsablehnung angewendet wurde. | Die Durchschnittszeit der Anforderungsdrosselung in Millisekunden. | 
| TcpConnections | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Zeigt die Anzahl der eingehenden und ausgehenden TCP-Segmente an, für die das SYN-Flag gesetzt ist. | 
| TrafficBytes | Nachdem der Cluster den Status „ACTIVE“ erreicht hat. | Zeigt den Netzwerkverkehr in Gesamtbytes zwischen Clients (Produzenten und Verbrauchern) und Brokern an. Der Verkehr zwischen Brokern wird nicht berichtet. | 

## `PER_TOPIC_PER_PARTITION`Pegelüberwachung für Express-Broker
<a name="express-per-topic-per-partition-metrics"></a>

Wenn Sie die Überwachungsebene auf festlegen`PER_TOPIC_PER_PARTITION`, erhalten Sie zusätzlich zu allen Messwerten der `DEFAULT` Ebenen `PER_TOPIC_PER_BROKER``PER_BROKER`, und die in der folgenden Tabelle beschriebenen Kennzahlen. Nur die `DEFAULT` Level-Metriken sind kostenlos. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Verbrauchergruppe, Thema, Partition.


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| EstimatedTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Geschätzte Zeit (in Sekunden), um die Verzögerung beim Partitions-Offset zu verringern. | 
| OffsetLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Verbraucher-Verzögerung auf Partitionsebene als Anzahl von Offsets. | 
| RollingEstimatedTimeLag\$1 | Nachdem die Verbrauchergruppe von einem Thema konsumiert hat. | Schätzung der Rolling-Zeit (in Sekunden), um die Verzögerung beim Partitions-Offset zu verringern. | 

\$1 Bei Kennzahlen zur Verzögerung von Verbrauchern sind nur ASCII-Namen für Verbrauchergruppen erforderlich und es gelten spezifische Emissionsanforderungen. Weitere Informationen finden Sie unter [Überwachen Sie die Verzögerungen bei den Verbrauchern](consumer-lag.md).

## `PER_TOPIC_PER_BROKER`Füllstandskontrolle für Express-Broker
<a name="express-per-topic-per-broker-metrics"></a>

Wenn Sie die Überwachungsebene auf einstellen`PER_TOPIC_PER_BROKER`, erhalten Sie zusätzlich zu allen Messwerten der `DEFAULT` Ebenen `PER_BROKER` und die in der folgenden Tabelle beschriebenen Kennzahlen. Nur die `DEFAULT` Level-Metriken sind kostenlos. Die Metriken in dieser Tabelle haben die folgenden Dimensionen: Clustername, Broker-ID, Thema.

**Wichtig**  
Die Metriken in der folgenden Tabelle werden erst angezeigt, wenn ihre Werte zum ersten Mal ungleich Null werden. Um dies zu überprüfen BytesInPerSec, müssen beispielsweise zuerst ein oder mehrere Produzenten Daten an den Cluster senden.


| Name | Wenn sichtbar | Description | 
| --- | --- | --- | 
| MessagesInPerSec | Nachdem Sie ein Thema erstellt haben. | Die Anzahl der Nachrichten, die pro Sekunde empfangen werden. | 

# Überwachen Sie einen von MSK bereitgestellten Cluster mit Prometheus
<a name="open-monitoring"></a>

Sie können Ihren MSK Provisioned Cluster mit Prometheus überwachen, einem Open-Source-Überwachungssystem für metrische Zeitreihendaten. Sie können diese Daten mithilfe der Remote-Schreib-Feature von Prometheus in Amazon Managed Service für Prometheus veröffentlichen. [https://docs.newrelic.com/docs/integrations/amazon-integrations/aws-integrations-list/aws-managed-kafka-msk-integration](https://docs.newrelic.com/docs/integrations/amazon-integrations/aws-integrations-list/aws-managed-kafka-msk-integration) Die offene Überwachung ist kostenlos verfügbar, aber für die Übertragung von Daten über Availability Zones hinweg fallen Gebühren an.

Weitere Informationen zu Prometheus finden Sie in der [Prometheus-Dokumentation](https://prometheus.io/docs).

Informationen zur Verwendung von Prometheus finden Sie unter [Verbessern Sie die betrieblichen Erkenntnisse für Amazon MSK mithilfe von Amazon Managed Service für Prometheus und Amazon Managed](https://aws.amazon.com/blogs//big-data/enhance-operational-insights-for-amazon-msk-using-amazon-managed-service-for-prometheus-and-amazon-managed-grafana/) Grafana.

**Anmerkung**  
KRaft Im Metadatenmodus und bei MSK Express-Brokern können nicht sowohl die offene Überwachung als auch der öffentliche Zugriff aktiviert sein.

# Aktivieren Sie die offene Überwachung auf neuen von MSK bereitgestellten Clustern
<a name="enable-open-monitoring-at-creation"></a>

Dieses Verfahren beschreibt, wie Sie die offene Überwachung auf einem neuen MSK-Cluster mithilfe der AWS-Managementkonsole, der oder der AWS CLI Amazon MSK-API aktivieren.

**Unter Verwendung der AWS-Managementkonsole**

1. Melden Sie sich bei der AWS-Managementkonsole an und öffnen Sie die Amazon MSK-Konsole zu [https://console.aws.amazon.com/msk/Hause? region=us-east-1\$1/home/](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/).

1. Aktivieren Sie unter **Monitoring (Überwachung)** das Kontrollkästchen neben **Enable open monitoring with Prometheus (Offene Überwachung mit Prometheus aktivieren)**.

1. Geben Sie die erforderlichen Informationen in allen Abschnitten der Seite an und überprüfen Sie die verfügbaren Optionen.

1. Wählen Sie **Cluster erstellen**.

**Mit dem AWS CLI**
+ Rufen Sie den Befehl [create-cluster](https://docs.aws.amazon.com/cli/latest/reference/kafka/create-cluster.html) auf und geben Sie die Option `open-monitoring` an. Aktivieren Sie `JmxExporter`, `NodeExporter` oder beides. Wenn Sie `open-monitoring` angeben, können die beiden Exporteure nicht gleichzeitig deaktiviert werden.

**Verwenden der API**
+ Rufen Sie den [CreateCluster](https://docs.aws.amazon.com/msk/1.0/apireference/clusters.html#CreateCluster)Vorgang auf und geben Sie an`OpenMonitoring`. Aktivieren Sie `jmxExporter`, `nodeExporter` oder beides. Wenn Sie `OpenMonitoring` angeben, können die beiden Exporteure nicht gleichzeitig deaktiviert werden.

# Aktivieren Sie die offene Überwachung auf einem vorhandenen MSK Provisioned-Cluster
<a name="enable-open-monitoring-after-creation"></a>

Um die offene Überwachung zu aktivieren, stellen Sie sicher, dass sich der MSK Provisioned Cluster im Status befindet. `ACTIVE`

**Verwenden Sie den AWS-Managementkonsole**

1. Melden Sie sich bei der AWS-Managementkonsole an und öffnen Sie die Amazon MSK-Konsole zu [https://console.aws.amazon.com/msk/Hause? region=us-east-1\$1/home/](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/).

1. Wählen Sie den Namen des Clusters, den Sie aktualisieren möchten. Dadurch gelangen Sie zu einer Seite mit Details für den Cluster.

1. Scrollen Sie auf der Registerkarte **Eigenschaften** nach unten zum Abschnitt **Überwachung**.

1. Wählen Sie **Bearbeiten** aus.

1. Aktivieren Sie das Kontrollkästchen neben **Enable open monitoring with Prometheus (Offene Überwachung mit Prometheus aktivieren)**.

1. Wählen Sie **Änderungen speichern ** aus.

**Mit dem AWS CLI**
+ Rufen Sie den Befehl [update-monitoring](https://docs.aws.amazon.com/cli/latest/reference/kafka/update-monitoring.html) auf und geben Sie die Option `open-monitoring` an. Aktivieren Sie `JmxExporter`, `NodeExporter` oder beides. Wenn Sie `open-monitoring` angeben, können die beiden Exporteure nicht gleichzeitig deaktiviert werden.

**Verwenden der API**
+ Rufen Sie den [UpdateMonitoring](https://docs.aws.amazon.com/msk/1.0/apireference/clusters-clusterarn-monitoring.html#UpdateMonitoring)Vorgang auf und geben Sie an`OpenMonitoring`. Aktivieren Sie `jmxExporter`, `nodeExporter` oder beides. Wenn Sie `OpenMonitoring` angeben, können die beiden Exporteure nicht gleichzeitig deaktiviert werden.

# Richten Sie einen Prometheus-Host auf einer Amazon EC2 EC2-Instance ein
<a name="set-up-prometheus-host"></a>

Dieses Verfahren beschreibt, wie Sie einen Prometheus-Host mithilfe einer prometheus.yml-Datei einrichten.

1. Laden Sie den Prometheus-Server von [https://prometheus.io/download/#prometheus](https://prometheus.io/download/#prometheus) auf Ihre Amazon-EC2-Instance herunter.

1. Extrahieren Sie die heruntergeladene Datei in ein Verzeichnis und navigieren Sie zu diesem Verzeichnis.

1. Erstellen Sie eine Datei mit dem folgenden Inhalt und geben Sie ihr den Namen `prometheus.yml`.

   ```
   # file: prometheus.yml
   # my global config
   global:
     scrape_interval:     60s
   
   # A scrape configuration containing exactly one endpoint to scrape:
   # Here it's Prometheus itself.
   scrape_configs:
     # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
     - job_name: 'prometheus'
       static_configs:
       # 9090 is the prometheus server port
       - targets: ['localhost:9090']
     - job_name: 'broker'
       file_sd_configs:
       - files:
         - 'targets.json'
   ```

1. Verwenden Sie den [ListNodes](https://docs.aws.amazon.com//msk/1.0/apireference/clusters-clusterarn-nodes.html#ListNodes)Vorgang, um eine Liste der Broker Ihres Clusters abzurufen.

1. Erstellen Sie eine Datei namens `targets.json` mit dem folgenden JSON: Ersetzen Sie *broker\$1dns\$11**broker\$1dns\$12*, und die restlichen Broker-DNS-Namen durch die DNS-Namen, die Sie im vorherigen Schritt für Ihre Broker erhalten haben. Geben Sie alle Broker an, die Sie im vorherigen Schritt erhalten haben. Amazon MSK verwendet Port 11001 für den JMX Exporter und Port 11002 für den Node Exporter.

------
#### [ ZooKeeper mode targets.json ]

   ```
   [
     {
       "labels": {
         "job": "jmx"
       },
       "targets": [
         "broker_dns_1:11001",
         "broker_dns_2:11001",
         .
         .
         .
         "broker_dns_N:11001"
       ]
     },
     {
       "labels": {
         "job": "node"
       },
       "targets": [
         "broker_dns_1:11002",
         "broker_dns_2:11002",
         .
         .
         .
         "broker_dns_N:11002"
       ]
     }
   ]
   ```

------
#### [ KRaft mode targets.json ]

   ```
   [
     {
       "labels": {
         "job": "jmx"
       },
       "targets": [
         "broker_dns_1:11001",
         "broker_dns_2:11001",
         .
         .
         .
         "broker_dns_N:11001",
         "controller_dns_1:11001",
         "controller_dns_2:11001",
         "controller_dns_3:11001"
       ]
     },
     {
       "labels": {
         "job": "node"
       },
       "targets": [
         "broker_dns_1:11002",
         "broker_dns_2:11002",
         .
         .
         .
         "broker_dns_N:11002"
       ]
     }
   ]
   ```

------
**Anmerkung**  
Um JMX-Metriken von KRaft Controllern zu entfernen, fügen Sie der JSON-Datei Controller-DNS-Namen als Ziele hinzu. Beispiel: `controller_dns_1:11001` durch den tatsächlichen `controller_dns_1` DNS-Namen des Controllers ersetzen.

1. Um den Prometheus-Server auf Ihrer Amazon-EC2-Instance zu starten, führen Sie den folgenden Befehl in dem Verzeichnis aus, in dem Sie die Prometheus-Dateien extrahiert und `prometheus.yml` und `targets.json` gespeichert haben.

   ```
   ./prometheus
   ```

1. Suchen Sie die öffentliche IPv4-IP-Adresse der Amazon-EC2-Instance, auf der Sie Prometheus im vorherigen Schritt ausgeführt haben. Sie benötigen diese öffentliche IP-Adresse im folgenden Schritt.

1. Um auf die Prometheus-Weboberfläche zuzugreifen, öffnen Sie einen Browser, der auf Ihre Amazon EC2 EC2-Instance zugreifen kann, und gehen Sie zu`Prometheus-Instance-Public-IP:9090`, wo *Prometheus-Instance-Public-IP* ist die öffentliche IP-Adresse, die Sie im vorherigen Schritt erhalten haben.

# Verwenden Sie Prometheus-Metriken
<a name="prometheus-metrics"></a>

Alle von Apache Kafka an JMX ausgegebenen Metriken sind über eine offene Überwachung mit Prometheus zugänglich. Informationen zu Apache Kafka-Metriken finden Sie unter [Monitoring](https://kafka.apache.org/documentation/#monitoring) in der Apache Kafka-Dokumentation. Neben Apache Kafka-Metriken sind auch Consumer-Lag-Metriken auf Port 11001 unter dem Namen JMX verfügbar. MBean `kafka.consumer.group:type=ConsumerLagMetrics` Sie können auch den Prometheus Node Exporter verwenden, um CPU- und Festplattenmetriken für Ihre Broker von Port 11002 abzurufen.

# Speichern Sie Prometheus-Metriken in Amazon Managed Service for Prometheus
<a name="managed-service-prometheus"></a>

Amazon Managed Service for Prometheus ist ein Prometheus-kompatibler Service zur Überwachung und Warnung, den Sie zur Überwachung von Amazon-MSK-Clustern verwenden können. Es ist ein vollständig verwalteter Service, der die Aufnahme, Speicherung, Abfrage und Warnung Ihrer Metriken automatisch skaliert. Es lässt sich auch in AWS Sicherheitsdienste integrieren, um Ihnen einen schnellen und sicheren Zugriff auf Ihre Daten zu ermöglichen. Sie können die Open-Source-PromQL-Abfragesprache verwenden, um Ihre Metriken abzufragen und darauf zu warnen.

Weitere Informationen finden Sie unter [Erste Schritte mit Amazon Managed Service for Prometheus](https://docs.aws.amazon.com/prometheus/latest/userguide/AMP-getting-started.html).

# Überwachen Sie die Verzögerungen bei den Verbrauchern
<a name="consumer-lag"></a>

Durch die Überwachung der Verbraucher-Verzögerung können Sie langsame oder festsitzende Verbraucher identifizieren, die nicht mit den neuesten verfügbaren Daten zu einem Thema Schritt halten. Bei Bedarf können Sie dann Abhilfemaßnahmen ergreifen, z. B. diese Verbraucher skalieren oder neu starten. Um die Kundenverzögerung zu überwachen, können Sie Amazon CloudWatch oder Open Monitoring mit Prometheus verwenden.

Metriken zur Verbraucher-Verzögerung quantifizieren den Unterschied zwischen den neuesten Daten, die in Ihren Themen geschrieben wurden, und den Daten, die von Ihren Anwendungen gelesen wurden. Amazon MSK bietet die folgenden Messwerte für Kundenverzögerungen, die Sie über Amazon CloudWatch oder durch offene Überwachung mit Prometheus abrufen können:`EstimatedMaxTimeLag`,,, und`EstimatedTimeLag`. `MaxOffsetLag` `OffsetLag` `SumOffsetLag` Informationen zu diesen Metriken finden Sie unter [Amazon MSK-Metriken zur Überwachung von Standard-Brokern mit CloudWatch](metrics-details.md).

Amazon MSK unterstützt Verbraucher-Verzögerungs-Metriken für Cluster mit Apache Kafka 2.2.1 oder einer späteren Version. Beachten Sie bei der Arbeit mit Kafka und Metriken die folgenden Punkte: CloudWatch 
+ Kennzahlen zur Verzögerung von Verbrauchern werden nur ausgegeben, wenn sich eine Verbrauchergruppe im Status STABLE oder EMPTY befindet. Eine Verbrauchergruppe ist nach dem erfolgreichen Abschluss des Rebalancing STABIL, wodurch sichergestellt wird, dass die Partitionen gleichmäßig auf die Verbraucher verteilt sind.
+ In den folgenden Szenarien fehlen Kennzahlen zur Kundenverzögerung:
  + Wenn die Verbrauchergruppe instabil ist.
  + Der Name der Nutzergruppe enthält einen Doppelpunkt (:).
  + Sie haben den Verbraucher-Offset für die Nutzungsgruppe nicht festgelegt.
+ Die Namen der Verbrauchergruppen werden in als Dimensionen für Kennzahlen zur Kundenverzögerung verwendet CloudWatch. [Kafka unterstützt zwar UTF-8-Zeichen in Namen von Verbrauchergruppen, CloudWatch unterstützt jedoch nur ASCII-Zeichen für Dimensionswerte.](https://docs.aws.amazon.com/AmazonCloudWatch/latest/APIReference/API_Dimension.html) Wenn Sie Nicht-ASCII-Zeichen in Namen von Verbrauchergruppen verwenden, werden die Consumer-Lag-Metriken gelöscht. CloudWatch Um sicherzustellen, dass Ihre Kennzahlen zur Kundenverzögerung korrekt erfasst werden CloudWatch, dürfen Sie in den Namen Ihrer Verbrauchergruppen nur ASCII-Zeichen verwenden.

# Verwenden Sie Amazon MSK-Speicherkapazitätswarnungen
<a name="cluster-alerts"></a>

Auf von Amazon MSK bereitgestellten Clustern wählen Sie die primäre Speicherkapazität des Clusters aus. Wenn Sie die Speicherkapazität eines Brokers in Ihrem bereitgestellten Cluster ausschöpfen, kann sich dies auf dessen Fähigkeit auswirken, Daten zu produzieren und zu nutzen, was zu kostspieligen Ausfallzeiten führen kann. Amazon MSK bietet CloudWatch Metriken, mit denen Sie die Speicherkapazität Ihres Clusters überwachen können. Um Ihnen das Erkennen und Beheben von Speicherkapazitätsproblemen zu erleichtern, sendet Ihnen Amazon MSK jedoch automatisch dynamische Cluster-Speicherkapazitätswarnungen. Die Speicherkapazitätswarnungen enthalten Empfehlungen für kurzfristige und langfristige Schritte zur Verwaltung der Speicherkapazität Ihres Clusters. Von der [Amazon-MSK-Konsole](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/) aus können Sie Quicklinks in den Benachrichtigungen verwenden, um sofort empfohlene Maßnahmen zu ergreifen.

Es gibt zwei Arten von MSK-Warnmeldungen zur Speicherkapazität: proaktive Benachrichtigungen und Warnmeldungen zur Behebung von Problemen.
+ Proaktive („Aktion erforderlich“) Warnmeldungen zur Speicherkapazität warnen Sie vor potenziellen Speicherproblemen in Ihrem Cluster. Wenn ein Broker in einem MSK-Cluster mehr als 60 oder 80 % seiner Festplattenspeicherkapazität genutzt hat, erhalten Sie proaktive Benachrichtigungen zum betroffenen Broker. 
+ Bei Warnmeldungen zur Behebung der Speicherkapazität („Kritische Aktion erforderlich“) müssen Sie Abhilfemaßnahmen ergreifen, um ein kritisches Clusterproblem zu beheben, wenn einer der Broker in Ihrem MSK-Cluster über keine Festplattenspeicherkapazität mehr verfügt.

Amazon MSK sendet diese Benachrichtigungen automatisch an die [Amazon MSK-Konsole](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/), [AWS Health Dashboard](https://aws.amazon.com/premiumsupport/technology/aws-health/) EventBridge, [Amazon](https://aws.amazon.com/pm/eventbridge/) und E-Mail-Kontakte für Ihr AWS Konto. Sie können [Amazon auch so konfigurieren EventBridge](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-api-destination-partners.html), dass diese Benachrichtigungen an Slack oder an Tools wie New Relic und Datadog gesendet werden. 

Warnmeldungen zur Speicherkapazität sind standardmäßig für alle von MSK bereitgestellten Cluster aktiviert und können nicht deaktiviert werden. Dieses Feature ist in allen Regionen verfügbar, in denen MSK verfügbar ist.

## Überwachen Sie Warnmeldungen zur Speicherkapazität
<a name="cluster-alerts-monitoring"></a>

Sie können auf verschiedene Arten nach Warnmeldungen zur Speicherkapazität suchen:
+ Rufen Sie die [Amazon-MSK-Konsole](https://console.aws.amazon.com/msk/home?region=us-east-1#/home/) auf. Warnungen zur Speicherkapazität werden 90 Tage lang im Bereich „Cluster alerts“ (Clusterwarnungen) angezeigt. Die Warnmeldungen enthalten Empfehlungen und Einfachklick-Linkaktionen, um Probleme mit der Festplattenspeicherkapazität zu beheben.
+ Verwenden Sie [ListClustersListClusters](https://docs.aws.amazon.com/msk/1.0/apireference/clusters.html#ListClusters)[V2](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters.html#ListClustersV2) oder [DescribeClusterV2 [DescribeCluster](https://docs.aws.amazon.com/msk/1.0/apireference/clusters-clusterarn.html#DescribeCluster)](https://docs.aws.amazon.com/MSK/2.0/APIReference/v2-clusters-clusterarn.html#DescribeClusterV2), APIs um alle Warnungen für einen Cluster anzuzeigen`CustomerActionStatus`.
+ Gehen Sie zum [AWS -Servicestatus](https://aws.amazon.com/premiumsupport/technology/aws-health/), um Benachrichtigungen von MSK und anderen AWS -Services anzuzeigen.
+ Richten Sie [AWS Health API](https://docs.aws.amazon.com/health/latest/ug/health-api.html) und [Amazon](https://docs.aws.amazon.com/eventbridge/latest/userguide/eb-api-destination-partners.html) ein EventBridge, um Warnmeldungen an Plattformen von Drittanbietern wie Datadog und Slack NewRelic weiterzuleiten.