Atualize modelos em produção - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atualize modelos em produção

As grades de proteção de implantação são um conjunto de opções de implantação de modelos no Amazon SageMaker Inference para atualizar seus modelos de aprendizado de máquina em produção. Usando as opções do total gerenciamento de implantações, você pode controlar a mudança do modelo atual em produção para um novo. Os modos de deslocamento de tráfego em implantações azul/verde, como canário e linear, oferecem controle da granularidade sobre o processo de deslocamento de tráfego do seu modelo atual para o novo durante o curso da atualização. Também há proteções integradas, como reversões automáticas que ajudam você a detectar problemas com antecedência e a tomar medidas corretivas automaticamente, antes que elas impactem significativamente a produção.

As proteções de implantação fornecem os seguintes benefícios:

  • Segurança de implantação durante a atualização dos ambientes de produção. Uma atualização de regressão para um ambiente de produção pode causar tempo de inatividade não planejado e impactos nos negócios, como maior latência do modelo e altas taxas de erro. As barreiras de proteção da implantação ajudam você a mitigar esses riscos fornecendo as práticas recomendadas e barreiras de proteção de segurança operacional integradas.

  • Implantação totalmente gerenciada. SageMaker cuida da configuração e orquestração dessas implantações e as integra aos mecanismos de atualização de endpoints. Você não precisa compilar e manter mecanismos de orquestração, monitoramento ou reversão. Você pode aproveitar SageMaker para configurar e orquestrar essas implantações e se concentrar em aproveitar o ML para seus aplicativos.

  • Visibilidade. Você pode acompanhar o progresso da sua implantação por meio da DescribeEndpointAPI ou por meio do Amazon CloudWatch Events (para endpoints compatíveis). Para saber mais sobre eventos em SageMaker, consulte a seção Alteração do estado de implantação do Endpoint emAutomatizando a Amazon com a Amazon SageMaker EventBridge. Observe que, se seu endpoint usar qualquer um dos recursos da Exclusions página, você não poderá usar CloudWatch Eventos.

nota

As barreiras de proteção de implantação se aplicam apenas aos tipos de endpoints Inferência assíncrona e Inferência em tempo real.

Como começar a usar

Oferecemos suporte a dois tipos de implantações para atualizar modelos em produção: implantações azul/verde e implantações de rolagem.

  • Implantações azul/verde: Você pode transferir o tráfego da sua frota antiga (a frota azul) para uma nova frota (a frota verde) com as atualizações. As implantações azul/verde oferecem vários modos de deslocamento de tráfego. Um modo de mudança de tráfego é uma configuração que especifica como SageMaker roteia o tráfego de endpoints para uma nova frota contendo suas atualizações. Os seguintes modos de deslocamento de tráfego fornecem diferentes níveis de controle sobre o processo de atualização do endpoint:

    • Deslocamento de tráfego de uma só vez transfere todo o seu tráfego de endpoints da frota azul para a frota verde. Quando o tráfego muda para a frota verde, seus CloudWatch alarmes pré-especificados da Amazon começam a monitorar a frota verde por um determinado período de tempo (o período de cozimento). Se nenhum alarme disparar durante o período de cozimento, a frota azul será SageMaker encerrada.

    • Deslocamento de tráfego do Canário transfere uma pequena parte de seu tráfego (um canário) para a frota verde e a monitora por um período de baking. Se o canário for bem-sucedido na frota verde, então SageMaker transferirá o resto do tráfego da frota azul para a frota verde antes de encerrar a frota azul.

    • Deslocamento de tráfego linear fornece ainda mais personalização sobre o número de etapas de deslocamento de tráfego e a porcentagem de tráfego a ser deslocada em cada etapa. Enquanto a mudança canária permite que você mude o tráfego em duas etapas, a mudança linear estende isso para n etapas espaçadas linearmente.

  • Implantações contínuas: você pode atualizar seu endpoint à medida que provisiona a capacidade de SageMaker forma incremental e transfere o tráfego para uma nova frota em etapas de um tamanho de lote especificado por você. As instâncias da nova frota são atualizadas com a nova configuração de implantação e, se nenhum CloudWatch alarme disparar durante o período de cozimento, as instâncias da frota antiga são SageMaker limpas. Essa opção oferece controle granular sobre a contagem de instâncias ou a porcentagem de capacidade alterada durante cada etapa.

Você pode criar e gerenciar sua implantação por meio da CreateEndpoint SageMaker API UpdateEndpointe dos AWS Command Line Interface comandos. Consulte as páginas individuais de implantação para obter mais detalhes de instrução sobre como configurar sua implantação. Observe que, se o seu endpoint usar qualquer uma das funcionalidades listadas na página Exclusions, você não poderá usar as barreiras de proteção de implantação.

Para seguir exemplos guiados que mostram como fazer barreiras de proteção de implantação, consulte nosso exemplo de blocos de anotações Jupyter para os modos de deslocamento de tráfego canário e linear.