Mise à jour de modèles en production

Les garde-fous de déploiement sont un ensemble d'options de déploiement de modèles SageMaker dans Amazon Inference pour mettre à jour vos modèles d'apprentissage automatique en production. À l'aide des options de déploiement entièrement gérées, vous pouvez contrôler le passage du modèle actuel en production à un nouveau. Les modes de déplacement du trafic dans les déploiements bleus/verts, tels que canary et linéaire, vous donnent un contrôle précis sur le processus de déplacement du trafic de votre modèle actuel vers le nouveau au cours de la mise à jour. Il existe également des sauvegardes intégrées telles que les restaurations automatiques qui vous aident à détecter les problèmes rapidement et à prendre automatiquement des mesures correctives avant que ces problèmes n'affectent considérablement la production.

Les barrières de protection de déploiement offrent les avantages suivants :

Sécurité de déploiement lors de la mise à jour des environnements de production. Une mise à jour régressive d'un environnement de production peut entraîner des temps d'arrêt imprévus et un impact commercial, tels qu'une latence accrue du modèle et des taux d'erreur élevés. Les barrières de protection de déploiement vous aident à atténuer ces risques en fournissant les bonnes pratiques et des barrières de protection de sécurité opérationnelle intégrées.
Déploiement entièrement géré. SageMaker se charge de configurer et d'orchestrer ces déploiements et de les intégrer aux mécanismes de mise à jour des terminaux. Vous n'avez pas besoin de créer et de maintenir des mécanismes d'orchestration, de surveillance ou de restauration. Vous pouvez en tirer parti SageMaker pour configurer et orchestrer ces déploiements et vous concentrer sur l'utilisation du machine learning pour vos applications.
Visibilité. Vous pouvez suivre la progression de votre déploiement via l'DescribeEndpointAPI ou Amazon CloudWatch Events (pour les points de terminaison pris en charge). Pour en savoir plus sur les événements survenus dans SageMaker, consultez la section sur le changement d'état de déploiement du terminal dansAutomatiser Amazon SageMaker avec Amazon EventBridge. Notez que si votre point de terminaison utilise l'une des fonctionnalités de la Exclusions page, vous ne pouvez pas utiliser CloudWatch les événements.

Note

Les barrières de protection de déploiement ne s'appliquent qu'aux types de points de terminaison Inférence asynchrone et Inférence en temps réel.

Comment démarrer

Nous prenons en charge deux types de déploiements pour mettre à jour les modèles en production : les déploiements bleus/verts et les déploiements propagés.

Déploiements bleu/vert : vous pouvez déplacer le trafic de votre ancienne flotte (la flotte bleue) vers une nouvelle flotte (flotte verte) avec les mises à jour. Les déploiements bleus/verts offrent plusieurs modes de déplacement du trafic. Un mode de transfert de trafic est une configuration qui indique comment SageMaker achemine le trafic des terminaux vers une nouvelle flotte contenant vos mises à jour. Les modes de transfert de trafic suivants vous offrent différents niveaux de contrôle sur le processus de mise à jour des points de terminaison :
- Déplacement de trafic All At once (Tout à la fois) déplace tout le trafic de vos points de terminaison de la flotte bleue vers la flotte verte. Une fois que le trafic passe à la flotte verte, vos CloudWatch alarmes Amazon prédéfinies commencent à surveiller la flotte verte pendant une durée définie (la période de cuisson). Si aucune alarme ne se SageMaker déclenche pendant la période de cuisson, la flotte bleue est interrompue.
- Déplacement du trafic Canary déplace une petite partie de votre trafic (un canary) vers la flotte verte et la surveille pendant une période de préparation. Si le canari réussit sur la flotte verte, le SageMaker reste du trafic passe de la flotte bleue à la flotte verte avant de terminer la flotte bleue.
- Déplacement de trafic linéaire déplace encore plus de personnalisation sur le nombre d'étapes de déplacement du trafic et le pourcentage de trafic à déplacer pour chaque étape. Alors que le déplacement Canary vous permet de déplacer le trafic en deux étapes, le déplacement linéaire étend cela à des étapes n espacées linéairement.
Déploiements propagés: vous pouvez mettre à jour votre terminal au fur et à mesure qu'il approvisionne SageMaker progressivement la capacité et transfère le trafic vers un nouveau parc par étapes selon la taille de lot que vous spécifiez. Les instances de la nouvelle flotte sont mises à jour avec la nouvelle configuration de déploiement, et si aucune CloudWatch alarme ne se déclenche pendant la période de cuisson, les instances de l'ancienne flotte SageMaker sont nettoyées. Cette option vous permet de contrôler précisément le nombre d'instances ou le pourcentage de capacité déplacé à chaque étape.

Vous pouvez créer et gérer votre déploiement via l'CreateEndpoint SageMaker API UpdateEndpointet AWS Command Line Interface les commandes. Consultez chacune des pages de déploiement pour plus de détails sur la façon de configurer votre déploiement. Notez que si votre point de terminaison utilise l'une des fonctions répertoriées sur la page Exclusions, vous ne pouvez pas utiliser de barrière de protection de déploiement.

Pour suivre des exemples guidés qui montrent comment utiliser les barrières de protection de déploiement, veuillez consulter nos exemples de blocs-notes Jupyter pour les modes de déplacement de trafic Canary et linéaire.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Inférence de grands modèles avec TorchServe

Configuration et surveillance de la restauration automatique