Monitoramento de endpoints do Amazon Comprehend - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Monitoramento de endpoints do Amazon Comprehend

Você pode ajustar a taxa de transferência do seu endpoint aumentando ou diminuindo o número de unidades de inferência (IUs). Para obter mais informações sobre a atualização do seu endpoint, consulte Atualizando os endpoints do Amazon Comprehend.

Você pode determinar a melhor forma de ajustar a taxa de transferência do seu endpoint monitorando seu uso com o console da Amazon CloudWatch .

Monitore o uso do seu endpoint com CloudWatch
  1. Faça login no AWS Management Console e abra o CloudWatch console.

  2. À esquerda, escolha Métricas e selecione Todas as métricas.

  3. Em Todas as métricas, escolha Comprehend.

    Exibição do console da página Métricas mostrando o painel Comprehend.
  4. O CloudWatch console exibe as dimensões das métricas do Comprehend. Escolha a EndpointArndimensão.

    Exibição do console da página de métricas do Amazon Comprehend mostrando a dimensão. EndpointArn

    O console exibe ProvisionedInferenceUnits,, RequestedInferenceUnitsConsumedInferenceUnits, e InferenceUtilizationpara cada um dos seus endpoints.

    CloudWatch console mostrando as quatro métricas.

    Selecione as quatro métricas e navegue até a guia Métricas representadas graficamente.

  5. Defina as colunas de estatística para RequestedInferenceUnitse ConsumedInferenceUnitspara Soma.

  6. Defina a coluna Estatística InferenceUtilizationpara Soma.

  7. Defina a coluna Estatística como Média. ProvisionedInferenceUnits

  8. Altere a coluna Período de todas as métricas para 1 minuto.

  9. Selecione InferenceUtilizatione selecione a seta para movê-la para um eixo Y separado.

    Seu gráfico está pronto para análise.

    Exibição do console mostrando as métricas representadas graficamente.

Com base nas CloudWatch métricas, você também pode configurar o escalonamento automático para ajustar automaticamente a taxa de transferência do seu endpoint. Para obter mais informações sobre como usar o ajuste de escala automático com os seus endpoints, consulte Ajuste de escala automático com endpoints.

  • ProvisionedInferenceUnits- Essa métrica representa o número médio de IUs provisionadas no momento em que a solicitação foi feita.

  • RequestedInferenceUnits- Isso se baseia no uso de cada solicitação enviada ao serviço que foi enviada para ser processada. Isso pode ser útil para comparar a solicitação enviada para ser processada com a que foi realmente processada sem obter throttling ()ConsumedInferenceUnits. O valor dessa métrica é calculado tomando o número de caracteres enviados para serem processados e dividindo-o pelo número de caracteres que podem ser processados em um minuto por 1 UI.

  • ConsumedInferenceUnits- Isso se baseia no uso de cada solicitação enviada ao serviço que foi processada com sucesso (não limitada). Isso pode ser útil quando você for comparar o que você consome com as IUs provisionadas. O valor dessa métrica é calculado tomando-se o número de caracteres processados e dividindo-o pelo número de caracteres que podem ser processados em um minuto por 1 UI.

  • InferenceUtilization- Isso é emitido por solicitação. Esse valor é calculado tomando as IUs consumidas definidas em ConsumedInferenceUnits, dividindo-as por ProvisionedInferenceUnitse convertendo-as em uma porcentagem de 100.

nota

Todas as métricas são emitidas somente para solicitações bem-sucedidas. A métrica não aparecerá se for proveniente de uma solicitação que foi limitada ou falhou devido a um erro interno do servidor ou do cliente.