

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Métricas do Amazon MSK para monitorar corretores padrão com CloudWatch
<a name="metrics-details"></a>

O Amazon MSK se integra à Amazon CloudWatch para que você possa coletar, visualizar e analisar CloudWatch métricas para seus corretores MSK Standard. As métricas que você configura para seus clusters provisionados pelo MSK são coletadas e enviadas automaticamente em intervalos de 1 CloudWatch minuto. Você pode definir o nível de monitoramento de um cluster do MSK Provisioned como um dos seguintes: `DEFAULT`, `PER_BROKER`, `PER_TOPIC_PER_BROKER` ou `PER_TOPIC_PER_PARTITION`. As tabelas nas seções a seguir mostram todas as métricas disponíveis em cada nível de monitoramento.

**nota**  
Os nomes de algumas métricas do Amazon MSK para CloudWatch monitoramento foram alterados na versão 3.6.0 e superior. Use os novos nomes para monitorar essas métricas. Para métricas com nomes alterados, a tabela abaixo mostra o nome usado nas versões 3.6.0 e posteriores, seguido pelo nome na versão 2.8.2.tiered.

As métricas no nível `DEFAULT` são gratuitas. Os preços de outras métricas estão descritos na página de [ CloudWatchpreços da Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## Monitoramento no nível `DEFAULT`
<a name="default-metrics"></a>

As métricas descritas na tabela a seguir estão disponíveis no nível de monitoramento `DEFAULT`. Elas são gratuitas.


| Nome | Quando visível | Dimensões | Description | 
| --- | --- | --- | --- | 
| ActiveControllerCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster | Somente um controlador por cluster deve estar ativo em qualquer momento. | 
| BurstBalance | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O saldo restante dos créditos de intermitência de entrada/saída para volumes do EBS no cluster. Use-o para investigar a latência ou a diminuição do throughput.<br />`BurstBalance` não é relatado para volumes do EBS quando o desempenho de linha de base de um volume for maior que o desempenho máximo de intermitência. Para obter mais informações, consulte [Créditos de E/S e desempenho de intermitência](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/ebs-volume-types.html#IOcredit). | 
| BytesInPerSec | Depois de criar um tópico. | Nome do cluster, ID do agente, tópico | O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico. | 
| BytesOutPerSec | Depois de criar um tópico. | Nome do cluster, ID do agente, tópico | O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico. | 
| ClientConnectionCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente, autenticação de cliente | O número de conexões de cliente autenticadas e ativas. | 
| ConnectionCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de conexões ativas autenticadas, não autenticadas e entre agentes.  | 
| CPUCreditBalance  | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de créditos ganhos de CPU que um agente acumulou desde que foi iniciado. Os créditos são acumulados no saldo de créditos após terem sido ganhos e são removidos do saldo de créditos quando são gastos. A falta de saldo de créditos de CPU pode afetar negativamente o desempenho do cluster. Você pode adotar medidas para reduzir a carga da CPU. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5. | 
| CpuIdle | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem de tempo ocioso da CPU. | 
| CpuIoWait | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O percentual de tempo ocioso da CPU durante uma operação de disco pendente. | 
| CpuSystem | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem de CPU no espaço do kernel. | 
| CpuUser | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem de CPU no espaço do usuário. | 
| GlobalPartitionCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster | O número de partições em todos os tópicos no cluster, excluindo réplicas. Como GlobalPartitionCount não inclui réplicas, a soma dos PartitionCount valores pode ser maior do que GlobalPartitionCount se o fator de replicação de um tópico for maior que 1. | 
| GlobalTopicCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster | Número total de tópicos em todos os agentes no cluster. | 
| EstimatedMaxTimeLag\* | Depois que o grupo de consumidores consome de um tópico. | Nome do cluster, grupo de consumidores, tópico | Estimativa de tempo (em segundos) para drenar MaxOffsetLag. | 
| KafkaAppLogsDiskUsed | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem de espaço em disco usada para logs de aplicativos. | 
| KafkaDataLogsDiskUsed (dimensão Cluster Name, Broker ID) | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem de espaço em disco usada para logs de dados. | 
| LeaderCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número total de líderes de partições por agente, sem incluir réplicas. | 
| MaxOffsetLag\* | Depois que o grupo de consumidores consome de um tópico. | Nome do cluster, grupo de consumidores, tópico | O atraso máximo de deslocamento entre todas as partições em um tópico. | 
| MemoryBuffered | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho, em bytes, da memória armazenada em buffer para o agente. | 
| MemoryCached | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho, em bytes, da memória armazenada em cache para o agente. | 
| MemoryFree | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho, em bytes, de memória que é gratuita e disponível para o agente. | 
| HeapMemoryAfterGC  | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O percentual da memória total da pilha em uso após a coleta de resíduos. | 
| MemoryUsed | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho, em bytes, de memória que está em uso pelo agente. | 
| MessagesInPerSec | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de mensagens recebidas por segundo do agente. | 
| NetworkRxDropped | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de pacotes de recebimento descartados. | 
| NetworkRxErrors | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de erros de recepção da rede para o agente. | 
| NetworkRxPackets | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de pacotes recebidos pelo agente. | 
| NetworkTxDropped | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de pacotes de transmissão descartados. | 
| NetworkTxErrors | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de erros de transmissão da rede para o agente. | 
| NetworkTxPackets | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de pacotes transmitidos pelo agente. | 
| OfflinePartitionsCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster | Número total de partições que estão offline no cluster. | 
| PartitionCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número total de partições de tópico por agente, incluindo réplicas. | 
| ProduceTotalTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tempo médio de produção em milissegundos. | 
| RequestBytesMean | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número médio de bytes de solicitações do agente. | 
| RequestTime | Após o controle de utilização da solicitação ser aplicado. | Nome do cluster, ID do agente | O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações. | 
| RootDiskUsed | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | A porcentagem do disco raiz usado pelo agente. | 
| RollingEstimatedTimeLagMax\* | Depois que o grupo de consumidores consome de um tópico. | Nome do cluster, grupo de consumidores, tópico | Estimativa de tempo máximo contínuo (em segundos) para eliminar o atraso de deslocamento da partição em todas as partições em um tópico. | 
| SumOffsetLag\* | Depois que o grupo de consumidores consome de um tópico. | Nome do cluster, grupo de consumidores, tópico | O atraso de deslocamento agregado para todas as partições em um tópico. | 
| SwapFree | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho, em bytes, de memória de swap que está disponível para o agente. | 
| SwapUsed  | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O tamanho em bytes de memória de swap que está em uso para o agente. | 
| TrafficShaping  | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | Métricas de alto nível que indicam o número de pacotes modelados (descartados ou enfileirados) devido ao excesso de alocações de rede. É possível obter detalhes mais aprofundados com as métricas de PER\_BROKER. | 
| UnderMinIsrPartitionCount | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de partições em minIsr do agente. | 
| UnderReplicatedPartitions | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | O número de partições sub-replicadas do agente. | 
| UserPartitionExists | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | Uma métrica booleana que indica a presença de uma partição de propriedade do usuário em um agente. O valor 1 indica a presença de partições no agente. | 
| ZooKeeperRequestLatencyMsMean  | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | Para cluster ZooKeeper baseado. A latência média em milissegundos para ZooKeeper solicitações do Apache do broker. | 
| ZooKeeperSessionState | Depois que o cluster passa para o estado ACTIVE. | Nome do cluster, ID do agente | Para cluster ZooKeeper baseado. Status da conexão da ZooKeeper sessão do broker, que pode ser um dos seguintes: NOT\_CONNECTED: '0.0', ASSOCIATING: '0.1', CONNECTING: '0.5', CONNECTEDREADONLY: '0.8', CONNECTED: '1.0', CLOSED: '5.0', AUTH\_FAILED: '10.0'. | 

\* As métricas de atraso do consumidor exigem nomes de grupos de consumidores somente em ASCII e têm requisitos de emissão específicos. Para obter mais informações, consulte [Monitorar atrasos do consumidor](consumer-lag.md).

## Monitoramento no nível `PER_BROKER`
<a name="broker-metrics"></a>

Ao definir o nível de monitoramento como `PER_BROKER`, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível `DEFAULT`. Você paga pelas métricas na tabela a seguir, enquanto as métricas de nível `DEFAULT` continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.


| Nome | Quando visível | Description | 
| --- | --- | --- | 
| BwInAllowanceExceeded | Depois que o cluster passa para o estado ACTIVE. | Número de pacotes formados porque a largura de banda agregada de entrada excedeu o máximo para o agente. | 
| BwOutAllowanceExceeded | Depois que o cluster passa para o estado ACTIVE. | Número de pacotes formados porque a largura de banda agregada de saída excedeu o máximo para o agente. | 
| ConntrackAllowanceExceeded  | Depois que o cluster passa para o estado ACTIVE. | Número de pacotes formados porque o monitoramento de conexão excedeu o máximo para o agente. O monitoramento de conexão está relacionado a grupos de segurança que monitoram cada conexão estabelecida a fim de garantir que os pacotes de retorno sejam entregues conforme esperado.  | 
| ConnectionCloseRate | Depois que o cluster passa para o estado ACTIVE. | O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente. | 
| ConnectionCreationRate | Depois que o cluster passa para o estado ACTIVE. | O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente. | 
| CpuCreditUsage | Depois que o cluster passa para o estado ACTIVE. | O número de créditos de CPU gastos pelo agente. A falta de saldo de créditos de CPU pode afetar negativamente o desempenho do cluster. Você pode adotar medidas para reduzir a carga da CPU. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5. | 
| FetchConsumerLocalTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação do consumidor é processada no líder. | 
| FetchConsumerRequestQueueTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações. | 
| FetchConsumerResponseQueueTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta. | 
| FetchConsumerResponseSendTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio, em milissegundos, para que o consumidor envie uma resposta. | 
| FetchConsumerTotalTimeMsMean | Depois de haver um produtor/consumidor. | O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente. | 
| FetchFollowerLocalTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação do seguidor é processada no líder. | 
| FetchFollowerRequestQueueTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações. | 
| FetchFollowerResponseQueueTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta. | 
| FetchFollowerResponseSendTimeMsMean | Depois de haver um produtor/consumidor. | O tempo médio em milissegundos para o seguidor enviar uma resposta. | 
| FetchFollowerTotalTimeMsMean | Depois de haver um produtor/consumidor. | O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente. | 
| FetchMessageConversionsPerSec | Depois de criar um tópico. | O número de conversões de mensagens de busca por segundo do agente. | 
| FetchThrottleByteRate | Após o controle de utilização da largura de banda ser aplicado. | O número de bytes limitados por segundo. | 
| FetchThrottleQueueSize | Após o controle de utilização da largura de banda ser aplicado. | O número de mensagens na fila do controle de utilização. | 
| FetchThrottleTime | Após o controle de utilização da largura de banda ser aplicado. | O tempo médio de controle de utilização de busca em milissegundos. | 
| IAMNumberOfConnectionRequests | Depois que o cluster passa para o estado ACTIVE. | O número de solicitações de autenticação do IAM por segundo. | 
| IAMTooManyConnections | Depois que o cluster passa para o estado ACTIVE. | O número de conexões tentadas acima de 100. 0 significa que o número de conexões está dentro do limite. Se >0, o limite do controle de utilização está sendo excedido e você precisa reduzir o número de conexões. | 
| LinklocalAllowanceExceeded  | Depois que o cluster passa para o estado ACTIVE. | Número de pacotes descartados porque o PPS do tráfego para os serviços de proxy local excedeu o máximo para a interface da rede. Isso afeta o tráfego para o serviço de DNS, o Instance Metadata Service e o Amazon Time Sync Service. | 
| NetworkProcessorAvgIdlePercent | Depois que o cluster passa para o estado ACTIVE. | A porcentagem média do tempo em que os processadores de rede estão ociosos. | 
| PpsAllowanceExceeded | Depois que o cluster passa para o estado ACTIVE. | O número de pacotes formados porque o PPS bidirecional excedeu o máximo para o agente. | 
| ProduceLocalTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio em milissegundos que a solicitação leva para ser processada no líder. | 
| ProduceMessageConversionsPerSec | Depois de criar um tópico. | O número de conversões de mensagens de produção por segundo do agente. | 
| ProduceMessageConversionsTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio em milissegundos gasto em conversões de formato de mensagem. | 
| ProduceRequestQueueTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio em milissegundos que as mensagens de solicitação gastam na fila. | 
| ProduceResponseQueueTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio em milissegundos que as mensagens de resposta gastam na fila. | 
| ProduceResponseSendTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio em milissegundos gasto no envio de mensagens de resposta. | 
| ProduceThrottleByteRate | Após o controle de utilização da largura de banda ser aplicado. | O número de bytes limitados por segundo. | 
| ProduceThrottleQueueSize | Após o controle de utilização da largura de banda ser aplicado. | O número de mensagens na fila do controle de utilização. | 
| ProduceThrottleTime | Após o controle de utilização da largura de banda ser aplicado. | O tempo médio do controle de utilização da produção em milissegundos. | 
| ProduceTotalTimeMsMean | Depois que o cluster passa para o estado ACTIVE. | O tempo médio de produção em milissegundos. | 
| `RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)` | Depois de haver um produtor/consumidor. | O número total de bytes transferidos do armazenamento em camadas como resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) | Depois que houver um produtor/consumidor. | O número total de bytes transferidos para o armazenamento em camadas, incluindo dados de segmentos de log, índices e outros arquivos auxiliares. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogManagerTasksAvgIdlePercent | Depois que o cluster passa para o estado ACTIVE. | O percentual médio do tempo que o gerenciador remoto de logs ficou ocioso. O gerenciador remoto de logs transfere dados do agente para o armazenamento em camadas. Categoria: atividade interna. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogReaderAvgIdlePercent | Depois que o cluster passa para o estado ACTIVE. | O percentual médio do tempo que o leitor remoto de logs ficou ocioso. O leitor remoto de logs transfere dados do armazenamento remoto para o agente em resposta às buscas do consumidor. Categoria: atividade interna. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogReaderTaskQueueSize | Depois que o cluster passa para o estado ACTIVE. | O número de tarefas responsáveis por leituras do armazenamento em camadas que estão aguardando para serem agendadas. Categoria: atividade interna. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) | Depois que o cluster passa para o estado ACTIVE. | A taxa total de erros em resposta às solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) | Depois que o cluster passa para o estado ACTIVE. | O número total de solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) | Depois que o cluster passa para o estado ACTIVE. | A taxa total de erros em resposta às solicitações de gravação que o agente especificado enviou ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogSizeBytes | Depois que o cluster passa para o estado ACTIVE. | O número de bytes armazenados na camada remota.<br />Essa métrica está disponível para clusters com armazenamento em camadas do Apache Kafka versão 3.7.x no Amazon MSK. | 
| ReplicationBytesInPerSec | Depois de criar um tópico. | O número de bytes por segundo recebidos dos outros agentes. | 
| ReplicationBytesOutPerSec | Depois de criar um tópico. | O número de bytes por segundo enviados para outros agentes. | 
| RequestExemptFromThrottleTime | Após o controle de utilização da solicitação ser aplicado. | O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações isentas de controle de utilização. | 
| RequestHandlerAvgIdlePercent | Depois que o cluster passa para o estado ACTIVE. | A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos. | 
| RequestThrottleQueueSize | Após o controle de utilização da solicitação ser aplicado. | O número de mensagens na fila do controle de utilização. | 
| RequestThrottleTime | Após o controle de utilização da solicitação ser aplicado. | O tempo médio do controle de utilização de solicitações em milissegundos. | 
| TcpConnections | Depois que o cluster passa para o estado ACTIVE. | Mostra o número de segmentos TCP de entrada e saída com o sinalizador SYN definido. | 
| RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) | Depois de criar um tópico. | O número total de bytes dos dados que são elegíveis para classificação hierárquica no agente, mas que ainda não foram transferidos para o armazenamento em camadas. Essas métricas mostram a eficiência da transferência de dados upstream. Conforme o atraso aumenta, a quantidade de dados que não persiste no armazenamento em camadas aumenta. Categoria: atraso de arquivamento. Essa não é uma métrica KIP-405. | 
| TrafficBytes | Depois que o cluster passa para o estado ACTIVE. | Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado. | 
| VolumeQueueLength | Depois que o cluster passa para o estado ACTIVE. | O número de solicitações de operação de leitura e gravação aguardando conclusão em um período especificado. | 
|  VolumeReadBytes  | Depois que o cluster passa para o estado ACTIVE. | O número de bytes lidos durante um período especificado. | 
| VolumeReadOps  | Depois que o cluster passa para o estado ACTIVE. | O número de operações de leitura durante um período especificado. | 
| VolumeTotalReadTime  | Depois que o cluster passa para o estado ACTIVE. | O número total de segundos gastos por todas as operações de leitura que foram concluídas durante um período especificado. | 
| VolumeTotalWriteTime  | Depois que o cluster passa para o estado ACTIVE. | O número total de segundos gastos por todas as operações de gravação que foram concluídas durante um período especificado. | 
| VolumeWriteBytes  | Depois que o cluster passa para o estado ACTIVE. | O número de bytes gravados durante um período especificado. | 
| VolumeWriteOps  | Depois que o cluster passa para o estado ACTIVE. | O número de operações de gravação durante um período especificado. | 

## Monitoramento no nível `PER_TOPIC_PER_BROKER`
<a name="broker-topic-metrics"></a>

Ao definir o nível de monitoramento como `PER_TOPIC_PER_BROKER`, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis `PER_BROKER` e DEFAULT. Somente as métricas de nível `DEFAULT` são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.

**Importante**  
Para um cluster do Amazon MSK que use o Apache Kafka 2.4.1 ou uma versão mais recente, as métricas na tabela a seguir só aparecerão depois que os valores ficarem diferentes de zero pela primeira vez. Por exemplo, para ver `BytesInPerSec`, um ou mais produtores devem primeiro enviar dados para o cluster. 


| Nome | Quando visível | Description | 
| --- | --- | --- | 
| FetchMessageConversionsPerSec | Depois de criar um tópico. | O número de mensagens obtidas convertidas por segundo. | 
| MessagesInPerSec | Depois de criar um tópico. | O número de mensagens recebidas por segundo. | 
| ProduceMessageConversionsPerSec | Depois de criar um tópico. | O número de conversões por segundo de mensagens produzidas. | 
| RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered) | Após criar um tópico e o tópico estiver produzindo/consumindo. | O número de bytes transferidos do armazenamento em camadas em resposta às buscas do consumidor para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) | Após criar um tópico e o tópico estiver produzindo/consumindo. | O número de bytes transferidos para o armazenamento em camadas, para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) | Após criar um tópico e o tópico estiver produzindo/consumindo. | A taxa de erros em resposta às solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) | Após criar um tópico e o tópico estiver produzindo/consumindo. | O número de solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) | Após criar um tópico e o tópico estiver produzindo/consumindo. | A taxa de erros em resposta às solicitações de gravação que o agente especificado envia ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica [KIP-405](https://cwiki.apache.org/confluence/display/KAFKA/KIP-405%3A+Kafka+Tiered+Storage). | 
| RemoteLogSizeBytes | Depois de criar um tópico. | O número de bytes armazenados na camada remota.<br />Essa métrica está disponível para clusters com armazenamento em camadas do Apache Kafka versão 3.7.x no Amazon MSK. | 

## Monitoramento no nível `PER_TOPIC_PER_PARTITION`
<a name="topic-partition-metrics"></a>

Ao definir o nível de monitoramento como `PER_TOPIC_PER_PARTITION`, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos níveis `PER_TOPIC_PER_BROKER`, `PER_BROKER` e DEFAULT. Somente as métricas de nível `DEFAULT` são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.


| Nome | Quando visível | Description | 
| --- | --- | --- | 
| EstimatedTimeLag\* | Depois que o grupo de consumidores consome de um tópico. | Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição. | 
| OffsetLag\* | Depois que o grupo de consumidores consome de um tópico. | Atraso do consumidor no nível de partição em número de deslocamentos. | 
| RollingEstimatedTimeLag\* | Depois que o grupo de consumidores consome de um tópico. | Estimativa do tempo de rolamento (em segundos) para eliminar o atraso no deslocamento da partição. | 

\* As métricas de atraso do consumidor exigem nomes de grupos de consumidores somente em ASCII e têm requisitos de emissão específicos. Para obter mais informações, consulte [Monitorar atrasos do consumidor](consumer-lag.md).