Monitoramento da integridade do Kinesis Agent - Amazon Data Firehose

Monitoramento da integridade do Kinesis Agent

O Kinesis Agent publica métricas personalizadas do CloudWatch com um namespace AWSKinesisAgent. Ele ajuda a avaliar a integridade do agente, enviando dados para o Amazon Data Firehose conforme especificado e consumindo a quantidade apropriada de CPU e de recursos de memória no produtor de dados.

As métricas, como número de registros e bytes enviados, são úteis para compreender a taxa em que o agente está enviando dados ao fluxo do Firehose. Quando essas métricas ficarem abaixo dos limites esperados em alguns percentuais ou caírem para zero, isso poderá indicar problemas de configuração, erros de rede ou problemas de integridade do agente. As métricas como consumo de CPU e memória no host e contadores de erros do agente indicam uso de recurso por parte do produtor de dados e fornece informações sobre erros potenciais de configuração ou de host. Por fim, o agente também registra exceções de serviço para ajudar a investigar problemas do agente.

As métricas do agente são reportadas na região especificada na configuração de agente cloudwatch.endpoint. Para ter mais informações, consulte Especificação das definições de configuração do agente.

As métricas do Cloudwatch publicadas de vários Kinesis Agents são agregadas ou combinadas.

Há um custo nominal para as métricas emitidas pelo Kinesis Agent, que são habilitadas por padrão. Para obter mais informações, consulte Amazon CloudWatch Pricing (Preços do Amazon CloudWatch).

Monitorar com o CloudWatch

O Kinesis Agent envia as métricas a seguir para o CloudWatch.

Métrica Descrição
BytesSent

O número de bytes enviados para o fluxo do Firehose no período especificado.

Unidade: bytes

RecordSendAttempts

O número de tentativas de registro (primeira vez ou como nova tentativa) em uma chamada para PutRecordBatch no período especificado.

Unidades: contagem

RecordSendErrors

O número de registros que retornaram status de falha em uma chamada para PutRecordBatch, incluindo novas tentativas, no período especificado.

Unidades: contagem

ServiceErrors

O número de chamadas para PutRecordBatch que resultaram em erro de serviço (diferente de um erro de controle de utilização) no período especificado.

Unidades: contagem