Monitoramento de nível PADRÃO Monitoramento de nível PER_BROKER PER_TOPIC_PER_BROKER Monitoramento de nível PER_TOPIC_PER_PARTITION Monitoramento de nível

Métricas do Amazon MSK para monitorar corretores padrão com CloudWatch

O Amazon MSK se integra à Amazon CloudWatch para que você possa coletar, visualizar e analisar CloudWatch métricas para seus corretores MSK Standard. As métricas que você configura para seus clusters provisionados pelo MSK são coletadas e enviadas automaticamente em intervalos de 1 CloudWatch minuto. Você pode definir o nível de monitoramento de um cluster do MSK Provisioned como um dos seguintes: DEFAULT, PER_BROKER, PER_TOPIC_PER_BROKER ou PER_TOPIC_PER_PARTITION. As tabelas nas seções a seguir mostram todas as métricas disponíveis em cada nível de monitoramento.

nota

Os nomes de algumas métricas do Amazon MSK para CloudWatch monitoramento foram alterados na versão 3.6.0 e superior. Use os novos nomes para monitorar essas métricas. Para métricas com nomes alterados, a tabela abaixo mostra o nome usado nas versões 3.6.0 e posteriores, seguido pelo nome na versão 2.8.2.tiered.

As métricas no nível DEFAULT são gratuitas. Os preços de outras métricas estão descritos na página de CloudWatchpreços da Amazon.

Monitoramento de nível `PADRÃO`

As métricas descritas na tabela a seguir estão disponíveis no nível de monitoramento DEFAULT. Elas são gratuitas.

Nome	Quando visível	Dimensões	Description
`ActiveControllerCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	Somente um controlador por cluster deve estar ativo em qualquer momento.
`BurstBalance`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O saldo restante dos créditos de intermitência de entrada/saída para volumes do EBS no cluster. Use-o para investigar a latência ou a diminuição do throughput. `BurstBalance` não é relatado para volumes do EBS quando o desempenho de linha de base de um volume for maior que o desempenho máximo de intermitência. Para obter mais informações, consulte I/O Créditos e desempenho máximo.
`BytesInPerSec`	Depois de criar um tópico.	Nome do cluster, ID do agente, tópico	O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico.
`BytesOutPerSec`	Depois de criar um tópico.	Nome do cluster, ID do agente, tópico	O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico.
`ClientConnectionCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente, autenticação de cliente	O número de conexões de cliente autenticadas e ativas.
`ConnectionCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de conexões ativas autenticadas, não autenticadas e entre agentes.
`CPUCreditBalance`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de créditos ganhos de CPU que um agente acumulou desde que foi iniciado. Os créditos são acumulados no saldo de créditos após terem sido ganhos e são removidos do saldo de créditos quando são gastos. A falta de saldo de créditos de CPU pode afetar negativamente o desempenho do cluster. Você pode adotar medidas para reduzir a carga da CPU. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5.
`CpuIdle`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de tempo ocioso da CPU.
`CpuIoWait`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O percentual de tempo ocioso da CPU durante uma operação de disco pendente.
`CpuSystem`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de CPU no espaço do kernel.
`CpuUser`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de CPU no espaço do usuário.
`GlobalPartitionCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	O número de partições em todos os tópicos no cluster, excluindo réplicas. Como `GlobalPartitionCount` não inclui réplicas, a soma dos `PartitionCount` valores pode ser maior do que GlobalPartitionCount se o fator de replicação de um tópico for maior que 1.
`GlobalTopicCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	Número total de tópicos em todos os agentes no cluster.
`EstimatedMaxTimeLag*`	Depois que o grupo de consumidores consome de um tópico.	Nome do cluster, grupo de consumidores, tópico	Estimativa de tempo (em segundos) para drenar `MaxOffsetLag`.
`KafkaAppLogsDiskUsed`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de espaço em disco usada para logs de aplicativos.
`KafkaDataLogsDiskUsed` (dimensão `Cluster Name, Broker ID`)	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem de espaço em disco usada para logs de dados.
`LeaderCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número total de líderes de partições por agente, sem incluir réplicas.
`MaxOffsetLag*`	Depois que o grupo de consumidores consome de um tópico.	Nome do cluster, grupo de consumidores, tópico	O atraso máximo de deslocamento entre todas as partições em um tópico.
`MemoryBuffered`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, da memória armazenada em buffer para o agente.
`MemoryCached`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, da memória armazenada em cache para o agente.
`MemoryFree`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, de memória que é gratuita e disponível para o agente.
`HeapMemoryAfterGC`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O percentual da memória total da pilha em uso após a coleta de resíduos.
`MemoryUsed`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, de memória que está em uso pelo agente.
`MessagesInPerSec`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de mensagens recebidas por segundo do agente.
`NetworkRxDropped`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes de recebimento descartados.
`NetworkRxErrors`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de erros de recepção da rede para o agente.
`NetworkRxPackets`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes recebidos pelo agente.
`NetworkTxDropped`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes de transmissão descartados.
`NetworkTxErrors`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de erros de transmissão da rede para o agente.
`NetworkTxPackets`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de pacotes transmitidos pelo agente.
`OfflinePartitionsCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster	Número total de partições que estão offline no cluster.
`PartitionCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número total de partições de tópico por agente, incluindo réplicas.
`ProduceTotalTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tempo médio de produção em milissegundos.
`RequestBytesMean`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número médio de bytes de solicitações do agente.
`RequestTime`	Após o controle de utilização da solicitação ser aplicado.	Nome do cluster, ID do agente	O tempo médio em milissegundos gasto na rede do agente e nos I/O threads para processar solicitações.
`RootDiskUsed`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	A porcentagem do disco raiz usado pelo agente.
`RollingEstimatedTimeLagMax*`	Depois que o grupo de consumidores consome de um tópico.	Nome do cluster, grupo de consumidores, tópico	Estimativa de tempo máximo contínuo (em segundos) para eliminar o atraso de deslocamento da partição em todas as partições em um tópico.
`SumOffsetLag*`	Depois que o grupo de consumidores consome de um tópico.	Nome do cluster, grupo de consumidores, tópico	O atraso de deslocamento agregado para todas as partições em um tópico.
`SwapFree`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho, em bytes, de memória de swap que está disponível para o agente.
`SwapUsed`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O tamanho em bytes de memória de swap que está em uso para o agente.
`TrafficShaping`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	High-level métricas que indicam o número de pacotes formatados (descartados ou enfileirados) devido ao excesso de alocações de rede. É possível obter detalhes mais aprofundados com as métricas de PER_BROKER.
`UnderMinIsrPartitionCount`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de partições em minIsr do agente.
`UnderReplicatedPartitions`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	O número de partições sub-replicadas do agente.
`UserPartitionExists`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	Uma métrica booleana que indica a presença de uma partição de propriedade do usuário em um agente. O valor 1 indica a presença de partições no agente.
`ZooKeeperRequestLatencyMsMean`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	Para ZooKeeper-based cluster. A latência média em milissegundos para ZooKeeper solicitações do Apache do broker.
`ZooKeeperSessionState`	Depois que o cluster passa para o estado ACTIVE.	Nome do cluster, ID do agente	Para ZooKeeper-based cluster. Status de conexão da ZooKeeper sessão do broker, que pode ser um dos seguintes: NOT_CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH_FAILED: '10.0'.

* As métricas de defasagem ASCII-only do consumidor exigem nomes de grupos de consumidores e têm requisitos de emissão específicos. Para obter mais informações, consulte Monitorar atrasos do consumidor.

`Monitoramento de nível PER_BROKER`

Ao definir o nível de monitoramento como PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível DEFAULT. Você paga pelas métricas na tabela a seguir, enquanto as métricas de nível DEFAULT continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.

Nome	Quando visível	Description
`BwInAllowanceExceeded`	Depois que o cluster passa para o estado ACTIVE.	Número de pacotes formados porque a largura de banda agregada de entrada excedeu o máximo para o agente.
`BwOutAllowanceExceeded`	Depois que o cluster passa para o estado ACTIVE.	Número de pacotes formados porque a largura de banda agregada de saída excedeu o máximo para o agente.
`ConntrackAllowanceExceeded`	Depois que o cluster passa para o estado ACTIVE.	Número de pacotes formados porque o monitoramento de conexão excedeu o máximo para o agente. O monitoramento de conexão está relacionado a grupos de segurança que monitoram cada conexão estabelecida a fim de garantir que os pacotes de retorno sejam entregues conforme esperado.
`ConnectionCloseRate`	Depois que o cluster passa para o estado ACTIVE.	O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.
`ConnectionCreationRate`	Depois que o cluster passa para o estado ACTIVE.	O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.
`CpuCreditUsage`	Depois que o cluster passa para o estado ACTIVE.	O número de créditos de CPU gastos pelo agente. A falta de saldo de créditos de CPU pode afetar negativamente o desempenho do cluster. Você pode adotar medidas para reduzir a carga da CPU. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5.
`FetchConsumerLocalTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação do consumidor é processada no líder.
`FetchConsumerRequestQueueTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações.
`FetchConsumerResponseQueueTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta.
`FetchConsumerResponseSendTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio, em milissegundos, para que o consumidor envie uma resposta.
`FetchConsumerTotalTimeMsMean`	Depois de haver um producer/consumer.	O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente.
`FetchFollowerLocalTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação do seguidor é processada no líder.
`FetchFollowerRequestQueueTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações.
`FetchFollowerResponseQueueTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta.
`FetchFollowerResponseSendTimeMsMean`	Depois de haver um producer/consumer.	O tempo médio em milissegundos para o seguidor enviar uma resposta.
`FetchFollowerTotalTimeMsMean`	Depois de haver um producer/consumer.	O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente.
`FetchMessageConversionsPerSec`	Depois de criar um tópico.	O número de conversões de mensagens de busca por segundo do agente.
`FetchThrottleByteRate`	Após o controle de utilização da largura de banda ser aplicado.	O número de bytes limitados por segundo.
`FetchThrottleQueueSize`	Após o controle de utilização da largura de banda ser aplicado.	O número de mensagens na fila do controle de utilização.
`FetchThrottleTime`	Após o controle de utilização da largura de banda ser aplicado.	O tempo médio de controle de utilização de busca em milissegundos.
`IAMNumberOfConnectionRequests`	Depois que o cluster passa para o estado ACTIVE.	O número de solicitações de autenticação do IAM por segundo.
`IAMTooManyConnections`	Depois que o cluster passa para o estado ACTIVE.	O número de conexões tentadas acima de 100. 0 significa que o número de conexões está dentro do limite. Se >0, o limite do controle de utilização está sendo excedido e você precisa reduzir o número de conexões.
`LinklocalAllowanceExceeded`	Depois que o cluster passa para o estado ACTIVE.	Número de pacotes descartados porque o PPS do tráfego para os serviços de proxy local excedeu o máximo para a interface da rede. Isso afeta o tráfego para o serviço de DNS, o Instance Metadata Service e o Amazon Time Sync Service.
`NetworkProcessorAvgIdlePercent`	Depois que o cluster passa para o estado ACTIVE.	A porcentagem média do tempo em que os processadores de rede estão ociosos.
`PpsAllowanceExceeded`	Depois que o cluster passa para o estado ACTIVE.	O número de pacotes formados porque o PPS bidirecional excedeu o máximo para o agente.
`ProduceLocalTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que a solicitação leva para ser processada no líder.
`ProduceMessageConversionsPerSec`	Depois de criar um tópico.	O número de conversões de mensagens de produção por segundo do agente.
`ProduceMessageConversionsTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos gasto em conversões de formato de mensagem.
`ProduceRequestQueueTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que as mensagens de solicitação gastam na fila.
`ProduceResponseQueueTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos que as mensagens de resposta gastam na fila.
`ProduceResponseSendTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio em milissegundos gasto no envio de mensagens de resposta.
`ProduceThrottleByteRate`	Após o controle de utilização da largura de banda ser aplicado.	O número de bytes limitados por segundo.
`ProduceThrottleQueueSize`	Após o controle de utilização da largura de banda ser aplicado.	O número de mensagens na fila do controle de utilização.
`ProduceThrottleTime`	Após o controle de utilização da largura de banda ser aplicado.	O tempo médio do controle de utilização da produção em milissegundos.
`ProduceTotalTimeMsMean`	Depois que o cluster passa para o estado ACTIVE.	O tempo médio de produção em milissegundos.
`RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)`	Depois de haver um producer/consumer.	O número total de bytes transferidos do armazenamento em camadas como resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered)`	Depois de haver um producer/consumer.	O número total de bytes transferidos para o armazenamento em camadas, incluindo dados de segmentos de log, índices e outros arquivos auxiliares. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteLogManagerTasksAvgIdlePercent`	Depois que o cluster passa para o estado ACTIVE.	O percentual médio do tempo que o gerenciador remoto de logs ficou ocioso. O gerenciador remoto de logs transfere dados do agente para o armazenamento em camadas. Categoria: atividade interna. Essa é uma KIP-405métrica.
`RemoteLogReaderAvgIdlePercent`	Depois que o cluster passa para o estado ACTIVE.	O percentual médio do tempo que o leitor remoto de logs ficou ocioso. O leitor remoto de logs transfere dados do armazenamento remoto para o agente em resposta às buscas do consumidor. Categoria: atividade interna. Essa é uma KIP-405métrica.
`RemoteLogReaderTaskQueueSize`	Depois que o cluster passa para o estado ACTIVE.	O número de tarefas responsáveis por leituras do armazenamento em camadas que estão aguardando para serem agendadas. Categoria: atividade interna. Essa é uma KIP-405métrica.
`RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered)`	Depois que o cluster passa para o estado ACTIVE.	A taxa total de erros em resposta às solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered)`	Depois que o cluster passa para o estado ACTIVE.	O número total de solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered)`	Depois que o cluster passa para o estado ACTIVE.	A taxa total de erros em resposta às solicitações de gravação que o agente especificado enviou ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteLogSizeBytes`	Depois que o cluster passa para o estado ACTIVE.	O número de bytes armazenados na camada remota. Essa métrica está disponível para clusters com armazenamento em camadas do Apache Kafka versão 3.7.x no Amazon MSK.
`ReplicationBytesInPerSec`	Depois de criar um tópico.	O número de bytes por segundo recebidos dos outros agentes.
`ReplicationBytesOutPerSec`	Depois de criar um tópico.	O número de bytes por segundo enviados para outros agentes.
`RequestExemptFromThrottleTime`	Após o controle de utilização da solicitação ser aplicado.	O tempo médio em milissegundos gasto na rede do broker e nos I/O threads para processar solicitações isentas de limitação.
`RequestHandlerAvgIdlePercent`	Depois que o cluster passa para o estado ACTIVE.	A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos.
`RequestThrottleQueueSize`	Após o controle de utilização da solicitação ser aplicado.	O número de mensagens na fila do controle de utilização.
`RequestThrottleTime`	Após o controle de utilização da solicitação ser aplicado.	O tempo médio do controle de utilização de solicitações em milissegundos.
`TcpConnections`	Depois que o cluster passa para o estado ACTIVE.	Mostra o número de segmentos TCP de entrada e saída com o sinalizador SYN definido.
`RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered)`	Depois de criar um tópico.	O número total de bytes dos dados que são elegíveis para classificação hierárquica no agente, mas que ainda não foram transferidos para o armazenamento em camadas. Essas métricas mostram a eficiência da transferência de dados upstream. Conforme o atraso aumenta, a quantidade de dados que não persiste no armazenamento em camadas aumenta. Categoria: atraso de arquivamento. Isso não é uma KIP-405 métrica.
`TrafficBytes`	Depois que o cluster passa para o estado ACTIVE.	Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado.
`VolumeQueueLength`	Depois que o cluster passa para o estado ACTIVE.	O número de solicitações de operação de leitura e gravação aguardando conclusão em um período especificado.
`VolumeReadBytes`	Depois que o cluster passa para o estado ACTIVE.	O número de bytes lidos durante um período especificado.
`VolumeReadOps`	Depois que o cluster passa para o estado ACTIVE.	O número de operações de leitura durante um período especificado.
`VolumeTotalReadTime`	Depois que o cluster passa para o estado ACTIVE.	O número total de segundos gastos por todas as operações de leitura que foram concluídas durante um período especificado.
`VolumeTotalWriteTime`	Depois que o cluster passa para o estado ACTIVE.	O número total de segundos gastos por todas as operações de gravação que foram concluídas durante um período especificado.
`VolumeWriteBytes`	Depois que o cluster passa para o estado ACTIVE.	O número de bytes gravados durante um período especificado.
`VolumeWriteOps`	Depois que o cluster passa para o estado ACTIVE.	O número de operações de gravação durante um período especificado.

`PER_TOPIC_PER_BROKER Monitoramento de nível`

Ao definir o nível de monitoramento como PER_TOPIC_PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.

Importante

Para um cluster do Amazon MSK que use o Apache Kafka 2.4.1 ou uma versão mais recente, as métricas na tabela a seguir só aparecerão depois que os valores ficarem diferentes de zero pela primeira vez. Por exemplo, para ver BytesInPerSec, um ou mais produtores devem primeiro enviar dados para o cluster.

Nome	Quando visível	Description
`FetchMessageConversionsPerSec`	Depois de criar um tópico.	O número de mensagens obtidas convertidas por segundo.
`MessagesInPerSec`	Depois de criar um tópico.	O número de mensagens recebidas por segundo.
`ProduceMessageConversionsPerSec`	Depois de criar um tópico.	O número de conversões por segundo de mensagens produzidas.
`RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)`	Depois de criar um tópico e o tópico for producing/consuming.	O número de bytes transferidos do armazenamento em camadas em resposta às buscas do consumidor para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered)`	Depois de criar um tópico e o tópico for producing/consuming.	O número de bytes transferidos para o armazenamento em camadas, para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered)`	Depois de criar um tópico e o tópico for producing/consuming.	A taxa de erros em resposta às solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered)`	Depois de criar um tópico e o tópico for producing/consuming.	O número de solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered)`	Depois de criar um tópico e o tópico for producing/consuming.	A taxa de erros em resposta às solicitações de gravação que o agente especificado envia ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma KIP-405métrica.
`RemoteLogSizeBytes`	Depois de criar um tópico.	O número de bytes armazenados na camada remota. Essa métrica está disponível para clusters com armazenamento em camadas do Apache Kafka versão 3.7.x no Amazon MSK.

`PER_TOPIC_PER_PARTITION Monitoramento de nível`

Ao definir o nível de monitoramento como PER_TOPIC_PER_PARTITION, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis PER_TOPIC_PER_BROKER, PER_BROKER e DEFAULT. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.

Nome	Quando visível	Description
`EstimatedTimeLag*`	Depois que o grupo de consumidores consome de um tópico.	Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição.
`OffsetLag*`	Depois que o grupo de consumidores consome de um tópico.	Partition-level atraso do consumidor no número de compensações.
`RollingEstimatedTimeLag*`	Depois que o grupo de consumidores consome de um tópico.	Estimativa do tempo de rolamento (em segundos) para eliminar o atraso no deslocamento da partição.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Visualize métricas usando CloudWatch

Estados do cluster do MSK Provisioned