MSKMétricas da Amazon para monitoramento com CloudWatch - Amazon Managed Streaming for Apache Kafka

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

MSKMétricas da Amazon para monitoramento com CloudWatch

A Amazon MSK se integra à Amazon CloudWatch para que você possa coletar, visualizar e analisar CloudWatch métricas para seu MSK cluster da Amazon. As métricas que você configura para seu MSK cluster são coletadas e enviadas automaticamente CloudWatch em intervalos de 1 minuto. Você pode definir o nível de monitoramento de um MSK cluster como um dos seguintes:DEFAULT,PER_BROKER,PER_TOPIC_PER_BROKER, ouPER_TOPIC_PER_PARTITION. As tabelas nas seções a seguir mostram todas as métricas disponíveis em cada nível de monitoramento.

nota

Os nomes de algumas MSK métricas de CloudWatch monitoramento da Amazon foram alterados na versão 3.6.0 e superior. Use os novos nomes para monitorar essas métricas. Para métricas com nomes alterados, a tabela abaixo mostra o nome usado nas versões 3.6.0 e posteriores, seguido pelo nome na versão 2.8.2.tiered.

As métricas no nível DEFAULT são gratuitas. Os preços de outras métricas estão descritos na página de CloudWatchpreços da Amazon.

Monitoramento no nível DEFAULT

As métricas descritas na tabela a seguir estão disponíveis no nível de monitoramento DEFAULT. Elas são gratuitas.

Métricas disponíveis no nível de monitoramento DEFAULT
Nome Quando visível Dimensões Descrição
ActiveControllerCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster Somente um controlador por cluster deve estar ativo em qualquer momento.
BurstBalance

Depois que o cluster chegar ao ACTIVE estado.

Nome do cluster, ID do agente

O saldo restante dos créditos de pico de entrada-saída para EBS volumes no cluster. Use-o para investigar a latência ou a diminuição do throughput.

BurstBalancenão é relatado para EBS volumes quando o desempenho básico de um volume é maior do que o desempenho máximo de intermitência. Para obter mais informações, consulte Créditos de E/S e desempenho de intermitência.

BytesInPerSec Depois de criar um tópico. Nome do cluster, ID do agente, tópico O número de bytes por segundo recebidos dos clientes. Essa métrica está disponível por agente e também por tópico.
BytesOutPerSec Depois de criar um tópico. Nome do cluster, ID do agente, tópico O número de bytes por segundo enviados aos clientes. Essa métrica está disponível por agente e também por tópico.
ClientConnectionCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente, autenticação de cliente O número de conexões de cliente autenticadas e ativas.
ConnectionCount Depois que o cluster chegar ao ACTIVE estado.

Nome do cluster, ID do agente

O número de conexões ativas autenticadas, não autenticadas e entre agentes.
CPUCreditBalance

Depois que o cluster chegar ao ACTIVE estado.

Nome do cluster, ID do agente

O número de CPU créditos ganhos que uma corretora acumulou desde que foi lançada. Os créditos são acumulados no saldo de créditos após terem sido ganhos e são removidos do saldo de créditos quando são gastos. Se você ficar sem saldo de CPU crédito, isso pode ter um impacto negativo no desempenho do seu cluster. Você pode tomar medidas para reduzir a CPU carga. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5.

CpuIdle Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem de tempo CPU ocioso.
CpuIoWait Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem de tempo CPU ocioso durante uma operação de disco pendente.
CpuSystem Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem de espaço CPU no kernel.
CpuUser Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem do CPU espaço do usuário.
GlobalPartitionCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster O número de partições em todos os tópicos no cluster, excluindo réplicas. Como GlobalPartitionCount não inclui réplicas, a soma dos PartitionCount valores pode ser maior do que GlobalPartitionCount se o fator de replicação de um tópico for maior que 1.
GlobalTopicCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster Número total de tópicos em todos os agentes no cluster.
EstimatedMaxTimeLag Depois que o grupo de consumidores consome de um tópico. Grupo de consumidores, tópico Estimativa de tempo (em segundos) para drenar MaxOffsetLag.
KafkaAppLogsDiskUsed Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem de espaço em disco usada para logs de aplicativos.
KafkaDataLogsDiskUsed (dimensão Cluster Name, Broker ID) Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem de espaço em disco usada para logs de dados.
KafkaDataLogsDiskUsed (dimensão Cluster Name) Depois que o cluster chegar ao ACTIVE estado. Nome do cluster A porcentagem de espaço em disco usada para logs de dados.
LeaderCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número total de líderes de partições por agente, sem incluir réplicas.
MaxOffsetLag Depois que o grupo de consumidores consome de um tópico. Grupo de consumidores, tópico O atraso máximo de deslocamento entre todas as partições em um tópico.
MemoryBuffered Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho, em bytes, da memória armazenada em buffer para o agente.
MemoryCached Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho, em bytes, da memória armazenada em cache para o agente.
MemoryFree Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho, em bytes, de memória que é gratuita e disponível para o agente.
HeapMemoryAfterGC

Depois que o cluster chegar ao ACTIVE estado.

Nome do cluster, ID do agente

O percentual da memória total da pilha em uso após a coleta de resíduos.
MemoryUsed Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho, em bytes, de memória que está em uso pelo agente.
MessagesInPerSec Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de mensagens recebidas por segundo do agente.
NetworkRxDropped Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de pacotes de recebimento descartados.
NetworkRxErrors Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de erros de recepção da rede para o agente.
NetworkRxPackets Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de pacotes recebidos pelo agente.
NetworkTxDropped Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de pacotes de transmissão descartados.
NetworkTxErrors Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de erros de transmissão da rede para o agente.
NetworkTxPackets Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de pacotes transmitidos pelo agente.
OfflinePartitionsCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster Número total de partições que estão offline no cluster.
PartitionCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número total de partições de tópico por agente, incluindo réplicas.
ProduceTotalTimeMsMean Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tempo médio de produção em milissegundos.
RequestBytesMean Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número médio de bytes de solicitações do agente.
RequestTime Após a limitação da solicitação ser aplicada. Nome do cluster, ID do agente O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações.
RootDiskUsed Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente A porcentagem do disco raiz usado pelo agente.
SumOffsetLag Depois que o grupo de consumidores consome de um tópico. Grupo de consumidores, tópico O atraso de deslocamento agregado para todas as partições em um tópico.
SwapFree Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho, em bytes, de memória de swap que está disponível para o agente.
SwapUsed Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O tamanho em bytes de memória de swap que está em uso para o agente.
TrafficShaping

Depois que o cluster chegar ao ACTIVE estado.

Nome do cluster, ID do agente

Métricas de alto nível que indicam o número de pacotes modelados (descartados ou enfileirados) devido ao excesso de alocações de rede. Detalhes mais precisos estão disponíveis com PER _ BROKER metrics.

UnderMinIsrPartitionCount Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de minIsr partições inferiores do corretor.
UnderReplicatedPartitions Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente O número de partições sub-replicadas do agente.
ZooKeeperRequestLatencyMsMean Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente Para cluster ZooKeeper baseado. A latência média em milissegundos para ZooKeeper solicitações do Apache do broker.
ZooKeeperSessionState Depois que o cluster chegar ao ACTIVE estado. Nome do cluster, ID do agente Para cluster ZooKeeper baseado. Status da conexão da ZooKeeper sessão do broker, que pode ser um dos seguintes: NOT _CONNECTED: '0.0',ASSOCIATING: '0.1',CONNECTING: '0.5',CONNECTEDREADONLY: '0.8',CONNECTED: '1.0',CLOSED: '5.0', AUTH _FAILED: '10.0'.

Monitoramento no nível PER_BROKER

Ao definir o nível de monitoramento como PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas de nível DEFAULT. Você paga pelas métricas na tabela a seguir, enquanto as métricas de nível DEFAULT continuam gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente.

Métricas adicionais disponíveis a partir do nível de monitoramento PER_BROKER
Nome Quando visível Descrição
BwInAllowanceExceeded Depois que o cluster chegar ao ACTIVE estado.

Número de pacotes formados porque a largura de banda agregada de entrada excedeu o máximo para o agente.

BwOutAllowanceExceeded Depois que o cluster chegar ao ACTIVE estado.

Número de pacotes formados porque a largura de banda agregada de saída excedeu o máximo para o agente.

ConnTrackAllowanceExceeded Depois que o cluster chegar ao ACTIVE estado.

Número de pacotes formados porque o monitoramento de conexão excedeu o máximo para o agente. O monitoramento de conexão está relacionado a grupos de segurança que monitoram cada conexão estabelecida a fim de garantir que os pacotes de retorno sejam entregues conforme esperado.

ConnectionCloseRate Depois que o cluster chegar ao ACTIVE estado.

O número de conexões fechadas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.

ConnectionCreationRate Depois que o cluster chegar ao ACTIVE estado.

O número de novas conexões estabelecidas por segundo por receptor. Esse número é agregado por receptor e filtrado para os receptores do cliente.

CpuCreditUsage Depois que o cluster chegar ao ACTIVE estado.

O número de CPU créditos gastos pelo corretor. Se você ficar sem saldo de CPU crédito, isso pode ter um impacto negativo no desempenho do seu cluster. Você pode tomar medidas para reduzir a CPU carga. Por exemplo, você pode reduzir o número de solicitações de clientes ou atualizar o tipo de agente para um tipo de agente M5.

FetchConsumerLocalTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação do consumidor é processada no líder.
FetchConsumerRequestQueueTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de solicitações.
FetchConsumerResponseQueueTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação do consumidor aguarda na fila de resposta.
FetchConsumerResponseSendTimeMsMean Depois de haver um produtor/consumidor. O tempo médio, em milissegundos, para que o consumidor envie uma resposta.
FetchConsumerTotalTimeMsMean Depois de haver um produtor/consumidor. O tempo total médio em milissegundos que os consumidores gastam obtendo dados do agente.
FetchFollowerLocalTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação do seguidor é processada no líder.
FetchFollowerRequestQueueTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de solicitações.
FetchFollowerResponseQueueTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos que a solicitação de seguidor aguarda na fila de resposta.
FetchFollowerResponseSendTimeMsMean Depois de haver um produtor/consumidor. O tempo médio em milissegundos para o seguidor enviar uma resposta.
FetchFollowerTotalTimeMsMean Depois de haver um produtor/consumidor. O tempo total médio em milissegundos que os seguidores gastam obtendo e dados do agente.
FetchMessageConversionsPerSec Depois de criar um tópico. O número de conversões de mensagens de busca por segundo do agente.
FetchThrottleByteRate Depois que a limitação da largura de banda é aplicada. O número de bytes limitados por segundo.
FetchThrottleQueueSize Depois que a limitação da largura de banda é aplicada. O número de mensagens na fila de limitação.
FetchThrottleTime Depois que a limitação da largura de banda é aplicada. O tempo médio de limitações de busca em milissegundos.
IAMNumberOfConnectionRequests Depois que o cluster chegar ao ACTIVE estado. O número de solicitações de IAM autenticação por segundo.
IAMTooManyConnections Depois que o cluster chegar ao ACTIVE estado. O número de conexões tentadas além de 100. 0 significa que o número de conexões está dentro do limite. Se >0, o limite do acelerador está sendo excedido e você precisa reduzir o número de conexões.
NetworkProcessorAvgIdlePercent Depois que o cluster chegar ao ACTIVE estado. A porcentagem média do tempo em que os processadores de rede estão ociosos.
PpsAllowanceExceeded Depois que o cluster chegar ao ACTIVE estado.

O número de pacotes moldados porque o bidirecional PPS excedeu o máximo para o corretor.

ProduceLocalTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio em milissegundos que a solicitação leva para ser processada no líder.
ProduceMessageConversionsPerSec Depois de criar um tópico. O número de conversões de mensagens de produção por segundo do agente.
ProduceMessageConversionsTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio em milissegundos gasto em conversões de formato de mensagem.
ProduceRequestQueueTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio em milissegundos que as mensagens de solicitação gastam na fila.
ProduceResponseQueueTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio em milissegundos que as mensagens de resposta gastam na fila.
ProduceResponseSendTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio em milissegundos gasto no envio de mensagens de resposta.
ProduceThrottleByteRate Depois que a limitação da largura de banda é aplicada. O número de bytes limitados por segundo.
ProduceThrottleQueueSize Depois que a limitação da largura de banda é aplicada. O número de mensagens na fila de limitação.
ProduceThrottleTime Depois que a limitação da largura de banda é aplicada. O tempo médio de limitação da produção em milissegundos.
ProduceTotalTimeMsMean Depois que o cluster chegar ao ACTIVE estado. O tempo médio de produção em milissegundos.

RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

Depois de haver um produtor/consumidor.

O número total de bytes transferidos do armazenamento em camadas como resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered)

Depois de haver um produtor/consumidor.

O número total de bytes transferidos para o armazenamento em camadas, incluindo dados de segmentos de log, índices e outros arquivos auxiliares. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.

RemoteLogManagerTasksAvgIdlePercent

Depois que o cluster chegar ao ACTIVE estado.

O percentual médio do tempo que o gerenciador remoto de logs ficou ocioso. O gerenciador remoto de logs transfere dados do agente para o armazenamento em camadas. Categoria: atividade interna. Essa é uma métrica KIPde -405.
RemoteLogReaderAvgIdlePercent

Depois que o cluster chegar ao ACTIVE estado.

O percentual médio do tempo que o leitor remoto de logs ficou ocioso. O leitor remoto de logs transfere dados do armazenamento remoto para o agente em resposta às buscas do consumidor. Categoria: atividade interna. Essa é uma métrica KIPde -405.
RemoteLogReaderTaskQueueSize

Depois que o cluster chegar ao ACTIVE estado.

O número de tarefas responsáveis por leituras do armazenamento em camadas que estão aguardando para serem agendadas. Categoria: atividade interna. Essa é uma métrica KIPde -405.
RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered)

Depois que o cluster chegar ao ACTIVE estado.

A taxa total de erros em resposta às solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered)

Depois que o cluster chegar ao ACTIVE estado.

O número total de solicitações de leitura que o agente especificado enviou ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados downstream. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered)

Depois que o cluster chegar ao ACTIVE estado.

A taxa total de erros em resposta às solicitações de gravação que o agente especificado enviou ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições de tópicos que contribuem para o tráfego de transferência de dados upstream. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.
ReplicationBytesInPerSec Depois de criar um tópico. O número de bytes por segundo recebidos dos outros agentes.
ReplicationBytesOutPerSec Depois de criar um tópico. O número de bytes por segundo enviados para outros agentes.
RequestExemptFromThrottleTime Após a limitação da solicitação ser aplicada. O tempo médio gasto em milissegundos em threads de rede e de E/S do agente para processar solicitações isentas de limitação.
RequestHandlerAvgIdlePercent Depois que o cluster chegar ao ACTIVE estado. A porcentagem média do tempo em que os threads do manipulador de solicitações estão ociosos.
RequestThrottleQueueSize Após a limitação da solicitação ser aplicada. O número de mensagens na fila de limitação.
RequestThrottleTime Após a limitação da solicitação ser aplicada. O tempo médio da limitação de solicitações em milissegundos.
TcpConnections Depois que o cluster chegar ao ACTIVE estado.

Mostra o número de TCP segmentos de entrada e saída com o SYN sinalizador definido.

RemoteCopyLagBytes (TotalTierBytesLag in v2.8.2.tiered) Depois de criar um tópico. O número total de bytes dos dados que são elegíveis para classificação hierárquica no agente, mas que ainda não foram transferidos para o armazenamento em camadas. Essas métricas mostram a eficiência da transferência de dados upstream. Conforme o atraso aumenta, a quantidade de dados que não persiste no armazenamento em camadas aumenta. Categoria: atraso de arquivamento. Essa não é uma métrica de KIP -405.
TrafficBytes Depois que o cluster chegar ao ACTIVE estado.

Mostra o tráfego de rede em bytes gerais entre clientes (produtores e consumidores) e agentes. O tráfego entre agentes não é relatado.

VolumeQueueLength Depois que o cluster chegar ao ACTIVE estado.

O número de solicitações de operação de leitura e gravação aguardando conclusão em um período especificado.

VolumeReadBytes Depois que o cluster chegar ao ACTIVE estado.

O número de bytes lidos durante um período especificado.

VolumeReadOps Depois que o cluster chegar ao ACTIVE estado.

O número de operações de leitura durante um período especificado.

VolumeTotalReadTime Depois que o cluster chegar ao ACTIVE estado.

O número total de segundos gastos por todas as operações de leitura que foram concluídas durante um período especificado.

VolumeTotalWriteTime Depois que o cluster chegar ao ACTIVE estado.

O número total de segundos gastos por todas as operações de gravação que foram concluídas durante um período especificado.

VolumeWriteBytes Depois que o cluster chegar ao ACTIVE estado.

O número de bytes gravados durante um período especificado.

VolumeWriteOps Depois que o cluster chegar ao ACTIVE estado.

O número de operações de gravação durante um período especificado.

Monitoramento no nível PER_TOPIC_PER_BROKER

Ao definir o nível de monitoramento comoPER_TOPIC_PER_BROKER, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos DEFAULT níveis PER_BROKER e. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: nome do cluster, ID do agente, tópico.

Importante

Para um MSK cluster da Amazon que usa o Apache Kafka 2.4.1 ou uma versão mais recente, as métricas na tabela a seguir aparecem somente depois que seus valores se tornam diferentes de zero pela primeira vez. Por exemplo, para ver BytesInPerSec, um ou mais produtores devem primeiro enviar dados para o cluster.

Métricas adicionais disponíveis a partir do nível de monitoramento PER_TOPIC_PER_BROKER
Nome Quando visível Descrição
FetchMessageConversionsPerSec Depois de criar um tópico. O número de mensagens obtidas convertidas por segundo.
MessagesInPerSec Depois de criar um tópico. O número de mensagens recebidas por segundo.
ProduceMessageConversionsPerSec Depois de criar um tópico. O número de conversões por segundo de mensagens produzidas.
RemoteFetchBytesPerSec (RemoteBytesInPerSec in v2.8.2.tiered)

Após criar um tópico e o tópico estiver produzindo/consumindo.

O número de bytes transferidos do armazenamento em camadas em resposta às buscas do consumidor para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.

RemoteCopyBytesPerSec (RemoteBytesOutPerSec in v2.8.2.tiered) Após criar um tópico e o tópico estiver produzindo/consumindo.

O número de bytes transferidos para o armazenamento em camadas, para o tópico e o agente especificados. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.

RemoteFetchErrorsPerSec (RemoteReadErrorPerSec in v2.8.2.tiered) Após criar um tópico e o tópico estiver produzindo/consumindo. A taxa de erros em resposta às solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.
RemoteFetchRequestsPerSec (RemoteReadRequestsPerSec in v2.8.2.tiered) Após criar um tópico e o tópico estiver produzindo/consumindo. O número de solicitações de leitura que o agente especificado envia ao armazenamento em camadas para recuperar dados em resposta às buscas do consumidor sobre o tópico especificado. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados downstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.
RemoteCopyErrorsPerSec (RemoteWriteErrorPerSec in v2.8.2.tiered) Após criar um tópico e o tópico estiver produzindo/consumindo. A taxa de erros em resposta às solicitações de gravação que o agente especificado envia ao armazenamento em camadas para transferir dados upstream. Essa métrica inclui todas as partições do tópico que contribuem para o tráfego de transferência de dados upstream no agente especificado. Categoria: taxas de tráfego e erro. Essa é uma métrica KIPde -405.

Monitoramento no nível PER_TOPIC_PER_PARTITION

Ao definir o nível de monitoramento comoPER_TOPIC_PER_PARTITION, você obtém as métricas descritas na tabela a seguir, além de todas as métricas dos DEFAULT níveis PER_TOPIC_PER_BROKERPER_BROKER, e. Somente as métricas de nível DEFAULT são gratuitas. As métricas nesta tabela têm as seguintes dimensões: grupo de consumidores, tópico, partição.

Métricas adicionais disponíveis a partir do nível de monitoramento PER_TOPIC_PER_PARTITION
Nome Quando visível Descrição
EstimatedTimeLag Depois que o grupo de consumidores consome de um tópico. Estimativa de tempo (em segundos) para drenar o atraso no deslocamento da partição.
OffsetLag Depois que o grupo de consumidores consome de um tópico. Atraso do consumidor no nível de partição em número de deslocamentos.