Visualizar o status do endpoint - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Visualizar o status do endpoint

Se você quiser usar seu modelo treinado para realizar inferência em dados ativos, implante seu modelo em um endpoint em tempo real. Para garantir a latência adequada de suas previsões, você quer garantir que as instâncias que hospedam seu modelo estejam funcionando com eficiência. O recurso de monitoramento de endpoint do Painel de modelo exibe informações em tempo real sobre a configuração do endpoint e ajuda você a monitorar a performance do endpoint com métricas.

Configurações do monitor

O Model Dashboard tem links para páginas de detalhes de SageMaker endpoints existentes que exibem gráficos em tempo real das métricas que você pode selecionar na Amazon. CloudWatch Em seu painel, você pode acompanhar essas métricas à medida que seu endpoint está lidando com solicitações de inferência em tempo real. A seguir, algumas métricas que você pode selecionar:

  • CpuUtilization: A soma da utilização de cada CPU núcleo individual, com cada um variando de 0% a 100%.

  • MemoryUtilization: o percentual de memória de GPU usada pelos contêineres em uma instância variando de 0% a 100%.

  • DiskUtilization: o percentual de espaço do disco usado pelos contêineres em uma instância variando de 0% a 100%.

Para ver a lista completa de métricas que você pode visualizar em tempo real, consulte Métricas para monitorar a Amazon SageMaker com a Amazon CloudWatch.

Configurações de tempo de execução

A Amazon SageMaker oferece suporte à escalabilidade automática (escalabilidade automática) para seus modelos hospedados. O ajuste de escala automático ajusta dinamicamente o número de instâncias provisionadas para um modelo em resposta às alterações no workload. Quando a workload aumenta, o ajuste de escala automático disponibiliza mais instâncias online. Quando a workload diminui, o ajuste de escala automático remove as instâncias desnecessárias para que você não precise pagar pelas instâncias provisionadas que não está usando. Você pode personalizar as seguintes configurações de tempo de execução no Painel de modelo:

  • Atualizar ponderações: altere a quantidade de workload atribuída a cada instância com a ponderação numérica. Para obter mais informações sobre a ponderação de instâncias durante o escalonamento automático, consulte Configurar ponderação de instâncias para o Amazon Auto EC2 Scaling.

  • Atualizar contagem de instância: altere o número total de instâncias que podem atender seu workload quando aumenta.

Para obter mais informações sobre as configurações de tempo de execução do endpoint, consulte CreateEndpointConfig.

Definições de configuração de endpoint

As configurações de endpoint exibem as configurações especificadas quando você criou o endpoint. Essas configurações informam SageMaker quais recursos devem ser provisionados para seu endpoint. Algumas configurações incluídas são as seguintes:

  • Captura de dados: você pode escolher capturar informações sobre as entradas e saídas do seu endpoint. Por exemplo, talvez você queira obter uma amostra do tráfego de entrada para ver se os resultados estão correlacionados com dados de treinamento. Você pode personalizar sua frequência de amostragem, o formato dos dados armazenados e a localização dos dados armazenados no Amazon S3. Para obter mais informações sobre como definir a configuração de captura de dados, consulte Captura de dados.

  • Variantes de produção: consulte a discussão anterior em Configurações de runtime.

  • Configuração de invocação assíncrona: se seu endpoint for assíncrono, esta seção inclui o número máximo de solicitações simultâneas enviadas pelo cliente ao contêiner modelo, SageMaker a localização das notificações de sucesso e falha no Amazon S3 e a localização de saída das saídas do endpoint. Para mais informações sobre solicitações assíncronas, consulte Operações assíncronas de endpoint.

  • Chave de criptografia: você pode inserir sua chave de criptografia se quiser criptografar suas saídas.

Para obter mais informações sobre as configurações do endpoint, consulte CreateEndpointConfig.

Visualizar o status e a configuração de um endpoint

Para visualizar o status e a configuração do endpoint de um modelo, conclua as seguintes etapas:
  1. Abra o SageMaker console.

  2. Escolha Governança no painel esquerdo.

  3. Escolha Painel de Modelos.

  4. Na seção Modelos do Painel de Modelos, selecione o nome do modelo do endpoint que você deseja visualizar.

  5. Selecione o nome do endpoint na seção Endpoints.