As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Você pode usar https://console.aws.amazon.com/cloudwatch/ReplicationLatency
,MessageLag
, e ReplicatorThroughput
em um nível de tópico e agregado para cada Amazon MSK Replicator. As métricas são visíveis abaixo ReplicatorNameno namespace “AWS/Kafka”. Você também pode ver as métricas ReplicatorFailure
, AuthError
e ThrottleTime
para verificar se há problemas.
O console MSK exibe um subconjunto de CloudWatch métricas para cada replicador MSK. Na lista Replicadores do console, selecione o nome de um replicador e selecione a guia Monitoramento.
Métricas de replicador do MSK
As métricas a seguir descrevem as métricas de desempenho ou conexão do replicador do MSK.
AuthError as métricas não abrangem erros de autenticação em nível de tópico. Para monitorar os erros de autenticação em nível de tópico do MSK Replicator, monitore as métricas do Replicator e as ReplicationLatency métricas em nível de tópico do cluster de origem,. MessagesInPerSec Se um tópico ReplicationLatency cair para 0, mas o tópico ainda tiver dados sendo produzidos, isso indica que o replicador tem um problema de autenticação com o tópico. Verifique se o perfil do IAM de execução do serviço do replicador tem permissão suficiente para acessar o tópico.
Tipo de métrica | Métrica | Descrição | Dimensões | Unidade | Granularidade métrica bruta | Estatística bruta de agregação métrica |
---|---|---|---|---|---|---|
Performance | ReplicationLatency | O tempo necessário para que os registros sejam replicados da origem para o cluster de destino; a duração entre o tempo de produção do registro na origem e o tempo de replicação no destino. Se ReplicationLatency aumentar, verifique se os clusters têm partições suficientes para suportar a replicação. Pode ocorrer alta latência de replicação quando a contagem de partições for muito baixa para um throughput alto. | ReplicatorName | Milissegundos | Partition | Máximo |
ReplicatorName, Tópico | Milissegundos | Partition | Máximo | |||
Performance | MessageLag | Monitora a sincronização entre o MSK Replicator e o cluster de origem. MessageLag indica o atraso entre as mensagens produzidas no cluster de origem e as mensagens consumidas pelo replicador. Não é o atraso entre o cluster de origem e o de destino. Mesmo que o cluster de origem esteja indisponível ou interrompido, o replicador terminará de gravar a mensagem consumida no cluster de destino. Depois de uma interrupção, MessageLag mostra um aumento indicando o número de mensagens que o replicador está por trás do cluster de origem e isso pode ser monitorado até que o número de mensagens seja 0, mostrando que o replicador alcançou o cluster de origem. | ReplicatorName | Contagem | Partition | Soma |
ReplicatorName, Tópico | Contagem | Partition | Soma | |||
Performance | ReplicatorBytesInPerSec | Número médio de bytes processados pelo replicador por segundo. Os dados processados pelo Replicador do MSK consistem em todos os dados que o Replicador do MSK recebe, incluindo os dados replicados para o cluster de destino e os dados filtrados pelo Replicador do MSK (somente se o replicador estiver configurado com uma configuração de nomes de tópicos idênticos) para evitar que os dados sejam copiados de volta para o mesmo tópico de origem. Se o replicador estiver configurado com a configuração de nome de tópico “Prefixado”, ambas as métricas ReplicatorBytesInPerSec e ReplicatorThroughput terão o mesmo valor, pois nenhum dado será filtrado pelo Replicador do MSK. |
ReplicatorName | BytesPerSecond | ReplicatorName | Soma |
Performance | ReplicatorThroughput | Número médio de bytes replicados por segundo. Se ReplicatorThroughput optar por um tópico, verifique KafkaClusterPingSuccessCount AuthError as métricas para garantir que o replicador possa se comunicar com os clusters, verifique as métricas do cluster para garantir que o cluster não esteja inativo. | ReplicatorName | BytesPerSecond | Partition | Soma |
ReplicatorName, Tópico | BytesPerSecond | Partition | Soma | |||
Depure | AuthError | O número de conexões com falha na autenticação por segundo. Se essa métrica estiver acima de 0, você poderá verificar se a política do perfil de execução do serviço para o replicador é válida e garantir que não haja recusa de permissões definidas para as permissões do cluster. Com base na dimensão ClusterAlias, você pode identificar se o cluster de origem ou de destino está apresentando erros de autenticação. | ReplicatorName, ClusterAlias | Contagem | Operador | Soma |
Depure | ThrottleTime | O tempo médio em ms em que uma solicitação passou por controle de utilização pelos agentes no cluster. Defina o controle de utilização para evitar que o replicador do MSK sobrecarregue o cluster. Se essa métrica for 0, a latência de replicação não for alta e o replicatorThroughput for o esperado, o controle de utilização estará funcionando conforme o esperado. Se essa métrica estiver acima de 0, você poderá ajustar o controle de utilização adequadamente. | ReplicatorName, ClusterAlias | Milissegundos | Operador | Máximo |
Depure | ReplicatorFailure | O número de falhas que o replicador está enfrentando. | ReplicatorName | Contagem | Soma | |
Depure | KafkaClusterPingSuccessCount |
Indica a integridade da conexão do replicador com o cluster do Kafka. Se esse valor for 1, a conexão está íntegra. Se o valor for 0 ou não houver nenhum ponto de dados, a conexão não está íntegra. Se o valor for 0, você poderá verificar as configurações de permissão de rede ou IAM para o cluster do Kafka. Com base na ClusterAlias dimensão, você pode identificar se essa métrica é para o cluster de origem ou de destino. |
ReplicatorName, ClusterAlias | Contagem | Soma |