Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Monitoramento de endpoints do Amazon Comprehend

Modo de foco
Monitoramento de endpoints do Amazon Comprehend - Amazon Comprehend

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Você pode ajustar a taxa de transferência do seu endpoint aumentando ou diminuindo o número de unidades de inferência (). IUs Para obter mais informações sobre a atualização do seu endpoint, consulte Atualizando os endpoints do Amazon Comprehend.

Você pode determinar a melhor forma de ajustar a taxa de transferência do seu endpoint monitorando seu uso com o console da Amazon CloudWatch .

Monitore o uso do seu endpoint com CloudWatch
  1. Faça login no AWS Management Console e abra o CloudWatch console.

  2. À esquerda, escolha Métricas e selecione Todas as métricas.

  3. Em Todas as métricas, escolha Comprehend.

    Exibição do console da página Métricas mostrando o painel Comprehend.
  4. O CloudWatch console exibe as dimensões das métricas do Comprehend. Escolha a EndpointArndimensão.

    Exibição do console da página de métricas do Amazon Comprehend mostrando a dimensão. EndpointArn

    O console exibe ProvisionedInferenceUnits,, RequestedInferenceUnitsConsumedInferenceUnits, e InferenceUtilizationpara cada um dos seus endpoints.

    CloudWatch console mostrando as quatro métricas.

    Selecione as quatro métricas e navegue até a guia Métricas representadas graficamente.

  5. Defina as colunas de estatística para RequestedInferenceUnitse ConsumedInferenceUnitspara Soma.

  6. Defina a coluna Estatística InferenceUtilizationpara Soma.

  7. Defina a coluna Estatística como Média. ProvisionedInferenceUnits

  8. Altere a coluna Período de todas as métricas para 1 minuto.

  9. Selecione InferenceUtilizatione selecione a seta para movê-la para um eixo Y separado.

    Seu gráfico está pronto para análise.

    Tela do console mostrando as métricas representadas graficamente.

Com base nas CloudWatch métricas, você também pode configurar o escalonamento automático para ajustar automaticamente a taxa de transferência do seu endpoint. Para obter mais informações sobre como usar o ajuste de escala automático com os seus endpoints, consulte Ajuste de escala automático com endpoints.

  • ProvisionedInferenceUnits- Essa métrica representa o número médio de provisionados IUs no momento em que a solicitação foi feita.

  • RequestedInferenceUnits- Isso se baseia no uso de cada solicitação enviada ao serviço que foi enviada para ser processada. Isso pode ser útil para comparar a solicitação enviada para ser processada com a que foi realmente processada sem obter throttling ()ConsumedInferenceUnits. O valor dessa métrica é calculado tomando o número de caracteres enviados para serem processados e dividindo-o pelo número de caracteres que podem ser processados em um minuto por 1 UI.

  • ConsumedInferenceUnits- Isso se baseia no uso de cada solicitação enviada ao serviço que foi processada com sucesso (não limitada). Isso pode ser útil quando você compara o que está consumindo com o provisionado IUs. O valor dessa métrica é calculado tomando-se o número de caracteres processados e dividindo-o pelo número de caracteres que podem ser processados em um minuto por 1 UI.

  • InferenceUtilization- Isso é emitido por solicitação. Esse valor é calculado tomando o consumo IUs definido em ConsumedInferenceUnits, dividindo-o por ProvisionedInferenceUnitse convertendo em uma porcentagem de 100.

nota

Todas as métricas são emitidas somente para solicitações bem-sucedidas. A métrica não aparecerá se for proveniente de uma solicitação que foi limitada ou falhou devido a um erro interno do servidor ou do cliente.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.