MSKMétriques Amazon pour la surveillance avec CloudWatch - Amazon Managed Streaming for Apache Kafka

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

MSKMétriques Amazon pour la surveillance avec CloudWatch

Amazon MSK s'intègre à Amazon CloudWatch afin que vous puissiez collecter, consulter et analyser les CloudWatch métriques de votre MSK cluster Amazon. Les métriques que vous configurez pour votre MSK cluster sont automatiquement collectées et transmises à CloudWatch intervalles d'une minute. Vous pouvez définir le niveau de surveillance d'un MSK cluster sur l'un des niveaux suivants : DEFAULTPER_BROKER,PER_TOPIC_PER_BROKER, ouPER_TOPIC_PER_PARTITION. Les tableaux des sections suivantes présentent toutes les métriques disponibles à partir de chaque niveau de surveillance.

Note

Les noms de certaines MSK métriques Amazon pour la CloudWatch surveillance ont changé dans la version 3.6.0 et les versions ultérieures. Utilisez les nouveaux noms pour surveiller ces métriques. Pour les métriques dont le nom a changé, le tableau ci-dessous indique le nom utilisé dans les versions 3.6.0 et supérieures, suivi du nom dans la version 2.8.2.tiered.

Les métriques de niveau DEFAULT sont gratuites. La tarification des autres statistiques est décrite sur la page de CloudWatch tarification d'Amazon.

Surveillance de niveau DEFAULT

Les métriques décrites dans le tableau suivant sont disponibles au niveau de la surveillance DEFAULT. Elles sont libres.

Métriques disponibles au niveau de la surveillance DEFAULT
Nom Lorsqu'il est visible Dimensions Description
ActiveControllerCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster Un seul contrôleur par cluster doit être actif à un moment donné.
BurstBalance

Une fois que le cluster est arrivé à l'ACTIVEétat.

Nom du cluster, ID de l'agent

Le solde restant des crédits de rafale d'entrées-sorties pour les EBS volumes du cluster. Utilisez-le pour étudier la latence ou la diminution du débit.

BurstBalancen'est pas indiqué pour les EBS volumes dont les performances de base sont supérieures aux performances maximales en rafale. Pour de plus amples informations, consultez Crédits d'E/S et performances en rafale.

BytesInPerSec Après avoir créé une rubrique. Nom du cluster, ID de broker, rubrique Nombre d'octets par seconde reçus des clients. Cette métrique est disponible par agent et également par rubrique.
BytesOutPerSec Après avoir créé une rubrique. Nom du cluster, ID de broker, rubrique Nombre d'octets par seconde envoyés aux clients. Cette métrique est disponible par agent et également par rubrique.
ClientConnectionCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID de l'agent, authentification client Nombre de connexions client authentifiées actives.
ConnectionCount Une fois que le cluster est arrivé à l'ACTIVEétat.

Nom du cluster, ID du broker

Nombre de connexions actives authentifiées, non authentifiées et entre agents.
CPUCreditBalance

Une fois que le cluster est arrivé à l'ACTIVEétat.

Nom du cluster, ID du broker

Le nombre de CPU crédits accumulés par un courtier depuis son lancement. Les crédits sont accumulés dans le solde de crédits quand ils sont gagnés et supprimés du solde de crédits lorsqu’ils sont dépensés. Si vous n'avez plus de solde CPU créditeur, cela peut avoir un impact négatif sur les performances de votre cluster. Vous pouvez prendre des mesures pour réduire la CPU charge. Par exemple, vous pouvez réduire le nombre de demandes des clients ou remplacer le type d'agent par un type d'agent M5.

CpuIdle Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage de temps CPU d'inactivité.
CpuIoWait Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage de temps CPU d'inactivité pendant une opération de disque en attente.
CpuSystem Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage d'espace CPU dans le noyau.
CpuUser Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage de personnes CPU présentes dans l'espace utilisateur.
GlobalPartitionCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster Nombre de partitions parmi toutes les rubriques du cluster, à l'exception des réplicas. Comme il GlobalPartitionCount n'inclut pas les répliques, la somme des PartitionCount valeurs peut être plus élevée que GlobalPartitionCount si le facteur de réplication d'un sujet est supérieur à 1.
GlobalTopicCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster Nombre total de rubriques parmi tous les brokers du cluster.
EstimatedMaxTimeLag Après que le groupe de consommateurs a consommé à partir d'une rubrique. Groupe de consommateurs, rubrique Estimation du temps (en secondes) de purge de MaxOffsetLag.
KafkaAppLogsDiskUsed Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage d'espace disque utilisé pour les journaux d'application.
KafkaDataLogsDiskUsed (dimension Cluster Name, Broker ID) Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage d'espace disque utilisé pour les journaux de données.
KafkaDataLogsDiskUsed (dimension Cluster Name) Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster Pourcentage d'espace disque utilisé pour les journaux de données.
LeaderCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre total de leaders de partitions par agent, sans inclure les réplicas.
MaxOffsetLag Après que le groupe de consommateurs a consommé à partir d'une rubrique. Groupe de consommateurs, rubrique Retard de décalage maximal entre toutes les partitions d'une rubrique.
MemoryBuffered Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Taille en octets de mémoire tampon pour le broker.
MemoryCached Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Taille en octets de mémoire cache pour le broker.
MemoryFree Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker La taille en octets de mémoire qui est libre et disponible pour le broker.
HeapMemoryAfterGC

Une fois que le cluster est arrivé à l'ACTIVEétat.

Nom du cluster, ID du broker

Pourcentage de mémoire de tas totale utilisée après le récupérateur de mémoire.
MemoryUsed Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Taille en octets de mémoire utilisée pour le broker.
MessagesInPerSec Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre de messages entrants par seconde pour le broker.
NetworkRxDropped Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre de paquets de réception supprimés.
NetworkRxErrors Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre d'erreurs de réception réseau pour le broker.
NetworkRxPackets Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre de paquets reçus par le broker.
NetworkTxDropped Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre de paquets de transmission abandonnés.
NetworkTxErrors Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre d'erreurs de transmission réseau pour le broker.
NetworkTxPackets Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre de paquets transmis par le broker.
OfflinePartitionsCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster Nombre total de partitions hors connexion dans le cluster.
PartitionCount Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre total de partitions de rubrique par agent, y compris les réplicas.
ProduceTotalTimeMsMean Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Temps moyen de production en millisecondes.
RequestBytesMean Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Nombre moyen d'octets de demandes pour le broker.
RequestTime Après l'application de la limitation de demande. Nom du cluster, ID du broker Temps moyen en millisecondes passé dans le réseau de courtage et les threads d'E/S pour traiter les demandes.
RootDiskUsed Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Pourcentage du disque racine utilisé par le broker.
SumOffsetLag Après que le groupe de consommateurs a consommé à partir d'une rubrique. Groupe de consommateurs, rubrique Retard de décalage agrégé pour toutes les partitions d'une rubrique.
SwapFree Une fois que le cluster est arrivé à l'ACTIVEétat. Nom du cluster, ID du broker Taille en octets de mémoire d'échange disponible pour le broker.
SwapUsed Une fois que le cluster a atteint l'ACTIVEétat. Nom du cluster, ID du broker Taille en octets de mémoire d'échange utilisée pour le broker.
TrafficShaping

Une fois que le cluster a atteint l'ACTIVEétat.

Nom du cluster, ID du broker

Métriques de haut niveau indiquant le nombre de paquets formés (abandonnés ou mis en file d'attente) en raison du dépassement des allocations réseau. Des détails plus précis sont disponibles avec PER _ BROKER metrics.

UnderMinIsrPartitionCount Une fois que le cluster a atteint l'ACTIVEétat. Nom du cluster, ID du broker Le nombre de minIsr sous-partitions pour le courtier.
UnderReplicatedPartitions Une fois que le cluster a atteint l'ACTIVEétat. Nom du cluster, ID du broker Nombre de partitions sous-répliquées pour le broker.
ZooKeeperRequestLatencyMsMean Une fois que le cluster a atteint l'ACTIVEétat. Nom du cluster, ID du broker Pour ZooKeeper un cluster basé. Latence moyenne en millisecondes pour les ZooKeeper requêtes Apache provenant du broker.
ZooKeeperSessionState Une fois que le cluster a atteint l'ACTIVEétat. Nom du cluster, ID du broker Pour ZooKeeper un cluster basé. État de connexion de la ZooKeeper session du courtier, qui peut être l'un des suivants CONNECTED : NOT _ : '0.0', ASSOCIATING : '0.1', CONNECTING : '0.5', CONNECTEDREADONLY : '0.8', CONNECTED : '1.0', CLOSED : '5.0', AUTH _ FAILED : '10.0'.

Surveillance de niveau PER_BROKER

Lorsque vous définissez le niveau de surveillance sur PER_BROKER, vous obtenez les métriques décrites dans le tableau suivant en plus de toutes les métriques de niveau DEFAULT. Vous payez les métriques dans le tableau suivant, alors que les métriques de niveau DEFAULT restent libres. Les métriques que contient ce tableau présentent les dimensions suivantes : Nom du cluster, ID d’agent.

Métriques supplémentaires disponibles à partir du niveau de surveillance PER_BROKER
Nom Lorsqu'il est visible Description
BwInAllowanceExceeded Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de paquets formés parce que la bande passante agrégée entrante a dépassé le maximum de l'agent.

BwOutAllowanceExceeded Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de paquets formés parce que la bande passante agrégée sortante a dépassé le maximum de l'agent.

ConnTrackAllowanceExceeded Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de paquets formés parce que le suivi des connexions a dépassé le maximum de l'agent. Le suivi des connexions est lié aux groupes de sécurité qui assurent le suivi de chaque connexion établie pour que les paquets de retour soient livrés comme prévu.

ConnectionCloseRate Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de connexions fermées par seconde et par écouteur. Ce nombre est agrégé par écouteur et filtré pour les écouteurs clients.

ConnectionCreationRate Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de nouvelles connexions établies par seconde et par écouteur. Ce nombre est agrégé par écouteur et filtré pour les écouteurs clients.

CpuCreditUsage Une fois que le cluster a atteint l'ACTIVEétat.

Le nombre de CPU crédits dépensés par le courtier. Si vous n'avez plus de solde CPU créditeur, cela peut avoir un impact négatif sur les performances de votre cluster. Vous pouvez prendre des mesures pour réduire la CPU charge. Par exemple, vous pouvez réduire le nombre de demandes des clients ou remplacer le type d'agent par un type d'agent M5.

FetchConsumerLocalTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande du consommateur est traitée au niveau du leader.
FetchConsumerRequestQueueTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande du consommateur attend dans la file d'attente des demandes.
FetchConsumerResponseQueueTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande du consommateur attend dans la file d'attente de réponses.
FetchConsumerResponseSendTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pour envoyer une réponse au consommateur.
FetchConsumerTotalTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps total moyen, en millisecondes, que les consommateurs consacrent à l'extraction des données du broker.
FetchFollowerLocalTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande de suivi est traitée au niveau du leader.
FetchFollowerRequestQueueTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande de suivi attend dans la file d'attente des demandes.
FetchFollowerResponseQueueTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, pendant lequel la demande de suivi attend dans la file d'attente des réponses.
FetchFollowerResponseSendTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps moyen, en millisecondes, d'envoi d'une réponse par le suiveur.
FetchFollowerTotalTimeMsMean Une fois qu'il y a un producteur/consommateur. Temps total moyen, en millisecondes, consacré par les abonnés à la récupération des données du broker.
FetchMessageConversionsPerSec Après avoir créé une rubrique. Nombre de conversions de messages d'extraction par seconde pour le broker.
FetchThrottleByteRate Une fois la limitation de la bande passante appliquée. Nombre d'octets limités par seconde.
FetchThrottleQueueSize Une fois la limitation de la bande passante appliquée. Nombre de messages dans la file d'attente des limites.
FetchThrottleTime Une fois la limitation de la bande passante appliquée. Temps moyen de récupération des limites en millisecondes.
IAMNumberOfConnectionRequests Une fois que le cluster a atteint l'ACTIVEétat. Le nombre de demandes IAM d'authentification par seconde.
IAMTooManyConnections Une fois que le cluster a atteint l'ACTIVEétat. Le nombre de connexions tentées au-delà de 100. 0 signifie que le nombre de connexions est dans les limites. Si >0, la limite d'accélération est dépassée et vous devez réduire le nombre de connexions.
NetworkProcessorAvgIdlePercent Une fois que le cluster a atteint l'ACTIVEétat. Pourcentage moyen de temps pendant lequel les processeurs réseau sont inactifs.
PpsAllowanceExceeded Une fois que le cluster a atteint l'ACTIVEétat.

Le nombre de paquets façonnés parce que le mode bidirectionnel PPS a dépassé le maximum pour le courtier.

ProduceLocalTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen, en millisecondes, pendant lequel la demande est traitée au niveau du leader.
ProduceMessageConversionsPerSec Après avoir créé une rubrique. Nombre de conversions de messages de production par seconde pour le broker.
ProduceMessageConversionsTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen, en millisecondes, consacré aux conversions de format de message.
ProduceRequestQueueTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen, en millisecondes, que les messages de demande passent dans la file d'attente.
ProduceResponseQueueTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen, en millisecondes, que les messages de réponse passent dans la file d'attente.
ProduceResponseSendTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen, en millisecondes, consacré à l'envoi de messages de réponse.
ProduceThrottleByteRate Une fois la limitation de la bande passante appliquée. Nombre d'octets limités par seconde.
ProduceThrottleQueueSize Une fois la limitation de la bande passante appliquée. Nombre de messages dans la file d'attente des limites.
ProduceThrottleTime Une fois la limitation de la bande passante appliquée. Temps moyen de production de limites en millisecondes.
ProduceTotalTimeMsMean Une fois que le cluster a atteint l'ACTIVEétat. Temps moyen de production en millisecondes.

RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

Une fois qu'il y a un producteur/consommateur.

Nombre total d'octets transférés depuis le stockage hiérarchisé en réponse aux extractions du consommateur. Cette métrique inclut toutes les partitions de rubrique qui contribuent au trafic de transfert de données en aval. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered)

Une fois qu'il y a un producteur/consommateur.

Nombre total d'octets transférés vers le stockage hiérarchisé, y compris les données provenant de segments de journal, d'index et d'autres fichiers auxiliaires. Cette métrique inclut toutes les partitions de rubrique qui contribuent au trafic de transfert de données en amont. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.

RemoteLogManagerTasksAvgIdlePercent

Une fois que le cluster a atteint l'ACTIVEétat.

Pourcentage de temps moyen pendant lequel le gestionnaire de journaux distant est resté inactif. Le gestionnaire de journaux distant transfère les données de l'agent vers le stockage hiérarchisé. Catégorie : Activité interne. Il s'agit d'une métrique KIPde -405.
RemoteLogReaderAvgIdlePercent

Une fois que le cluster a atteint l'ACTIVEétat.

Pourcentage de temps moyen pendant lequel le lecteur de journaux distant est resté inactif. Le lecteur de journaux distant transfère les données du stockage distant à l'agent en réponse aux extractions du consommateur. Catégorie : Activité interne. Il s'agit d'une métrique KIPde -405.
RemoteLogReaderTaskQueueSize

Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de tâches responsables des lectures depuis le stockage hiérarchisé qui attendent d'être planifiées. Catégorie : Activité interne. Il s'agit d'une métrique KIPde -405.
RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered)

Une fois que le cluster a atteint l'ACTIVEétat.

Taux total d'erreurs en réponse aux demandes de lecture que l'agent spécifié a envoyées au stockage hiérarchisé pour récupérer des données en réponse aux extractions du consommateur. Cette métrique inclut toutes les partitions de rubrique qui contribuent au trafic de transfert de données en aval. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered)

Une fois que le cluster a atteint l'ACTIVEétat.

Nombre total de demandes de lecture que l'agent spécifié a envoyées au stockage hiérarchisé pour récupérer des données en réponse aux extractions du consommateur. Cette métrique inclut toutes les partitions de rubrique qui contribuent au trafic de transfert de données en aval. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered)

Une fois que le cluster a atteint l'ACTIVEétat.

Taux total d'erreurs en réponse aux demandes d'écriture que l'agent spécifié a envoyées au stockage hiérarchisé pour transférer des données en amont. Cette métrique inclut toutes les partitions de rubrique qui contribuent au trafic de transfert de données en amont. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.
ReplicationBytesInPerSec Après avoir créé une rubrique. Nombre d'octets par seconde reçus des autres agents.
ReplicationBytesOutPerSec Après avoir créé une rubrique. Nombre d'octets envoyés par seconde aux autres agents.
RequestExemptFromThrottleTime Après l'application de la limitation de demande. Temps moyen en millisecondes passé dans le réseau de courtage et les threads d'E/S pour traiter les demandes exemptées de la limitation.
RequestHandlerAvgIdlePercent Une fois que le cluster a atteint l'ACTIVEétat. Pourcentage moyen de temps pendant lequel les threads du gestionnaire de demandes sont inactifs.
RequestThrottleQueueSize Après l'application de la limitation de demande. Nombre de messages dans la file d'attente des limites.
RequestThrottleTime Après l'application de la limitation de demande. Temps moyen de limitation de demande en millisecondes.
TcpConnections Une fois que le cluster a atteint l'ACTIVEétat.

Affiche le nombre de TCP segments entrants et sortants avec le SYN drapeau activé.

RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) Après avoir créé une rubrique. Nombre total d'octets de données éligibles à la hiérarchisation sur l'agent mais qui n'ont pas encore été transférés vers le stockage hiérarchisé. Ces métriques montrent l'efficacité du transfert de données en amont. À mesure que le retard augmente, la quantité de données qui ne sont pas conservées dans le stockage hiérarchisé augmente. Catégorie : Retard d'archivage. Il ne s'agit pas d'une métrique KIP de -405.
TrafficBytes Une fois que le cluster a atteint l'ACTIVEétat.

Affiche le trafic réseau en nombre total d'octets entre les clients (producteurs et consommateurs) et les agents. Le trafic entre les agents n'est pas signalé.

VolumeQueueLength Une fois que le cluster a atteint l'ACTIVEétat.

Nombre de demandes d'opérations de lecture et d'écriture en attente de réalisation au cours d'une période donnée.

VolumeReadBytes Une fois que le cluster a atteint l'ACTIVEétat.

Nombre d'octets lus au cours d'une période donnée.

VolumeReadOps Une fois que le cluster a atteint l'ACTIVEétat.

Nombre total d'opérations de lecture au cours d'une période donnée.

VolumeTotalReadTime Une fois que le cluster a atteint l'ACTIVEétat.

Nombre total de secondes passées par toutes les opérations de lecture terminées, au cours d'une période donnée.

VolumeTotalWriteTime Une fois que le cluster a atteint l'ACTIVEétat.

Nombre total de secondes passées par toutes les opérations d'écriture terminées, au cours d'une période donnée.

VolumeWriteBytes Une fois que le cluster a atteint l'ACTIVEétat.

Nombre d'octets écrits au cours d'une période donnée.

VolumeWriteOps Une fois que le cluster a atteint l'ACTIVEétat.

Nombre total d'opérations d'écriture au cours d'une période donnée.

Surveillance de niveau PER_TOPIC_PER_BROKER

Lorsque vous définissez le niveau de surveillance surPER_TOPIC_PER_BROKER, vous obtenez les mesures décrites dans le tableau suivant, en plus de toutes les mesures des DEFAULT niveaux PER_BROKER et. Seules les métriques de niveau DEFAULT sont gratuites. Les métriques que contient ce tableau présentent les dimensions suivantes : Nom du cluster, ID d’agent, Rubrique.

Important

Pour un MSK cluster Amazon qui utilise Apache Kafka 2.4.1 ou une version plus récente, les métriques du tableau suivant apparaissent uniquement lorsque leurs valeurs sont devenues différentes de zéro pour la première fois. Par exemple, pour voir BytesInPerSec, un ou plusieurs producteurs doivent d'abord envoyer des données au cluster.

Métriques supplémentaires disponibles à partir du niveau de surveillance PER_TOPIC_PER_BROKER
Nom Lorsqu'il est visible Description
FetchMessageConversionsPerSec Après avoir créé une rubrique. Nombre de messages récupérés convertis par seconde.
MessagesInPerSec Après avoir créé une rubrique. Nombre de messages reçus par seconde.
ProduceMessageConversionsPerSec Après avoir créé une rubrique. Nombre de conversions par seconde pour les messages produits.
RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

Lorsque vous créez une rubrique et que la rubrique est en train de produire/consommer.

Nombre d'octets transférés depuis le stockage hiérarchisé en réponse aux extractions du consommateur pour la rubrique et l'agent spécifiés. Cette métrique inclut toutes les partitions de la rubrique qui contribuent au trafic de transfert de données en aval sur l'agent spécifié. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) Lorsque vous créez une rubrique et que la rubrique est en train de produire/consommer.

Nombre d'octets transférés vers le stockage hiérarchisé, pour la rubrique et l'agent spécifiés. Cette métrique inclut toutes les partitions de la rubrique qui contribuent au trafic de transfert de données en amont sur l'agent spécifié. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.

RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) Lorsque vous créez une rubrique et que la rubrique est en train de produire/consommer. Taux d'erreurs en réponse aux demandes de lecture que l'agent spécifié envoie au stockage hiérarchisé pour récupérer des données en réponse aux extractions du consommateur sur la rubrique spécifiée. Cette métrique inclut toutes les partitions de la rubrique qui contribuent au trafic de transfert de données en aval sur l'agent spécifié. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) Lorsque vous créez une rubrique et que la rubrique est en train de produire/consommer. Nombre de demandes de lecture que l'agent spécifié envoie au stockage hiérarchisé pour récupérer des données en réponse aux extractions du consommateur sur la rubrique spécifiée. Cette métrique inclut toutes les partitions de la rubrique qui contribuent au trafic de transfert de données en aval sur l'agent spécifié. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) Lorsque vous créez une rubrique et que la rubrique est en train de produire/consommer. Taux d'erreurs en réponse aux demandes d'écriture que l'agent spécifié envoie au stockage hiérarchisé pour transférer des données en amont. Cette métrique inclut toutes les partitions de la rubrique qui contribuent au trafic de transfert de données en amont sur l'agent spécifié. Catégorie : Trafic et taux d'erreur. Il s'agit d'une métrique KIPde -405.

Surveillance de niveau PER_TOPIC_PER_PARTITION

Lorsque vous définissez le niveau de surveillance surPER_TOPIC_PER_PARTITION, vous obtenez les mesures décrites dans le tableau suivant, en plus de toutes les mesures des DEFAULT niveaux PER_TOPIC_PER_BROKERPER_BROKER, et. Seules les métriques de niveau DEFAULT sont gratuites. Les métriques de ce tableau ont les dimensions suivantes : Groupe de consommateurs, Rubrique, Partition.

Métriques supplémentaires disponibles à partir du niveau de surveillance PER_TOPIC_PER_PARTITION
Nom Lorsqu'il est visible Description
EstimatedTimeLag Après que le groupe de consommateurs a consommé à partir d'une rubrique. Estimation du temps (en secondes) nécessaire pour éliminer le retard de décalage de la partition.
OffsetLag Après que le groupe de consommateurs a consommé à partir d'une rubrique. Retard des consommateurs au niveau de la partition en nombre de décalages.