Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Garde-fous de déploiement pour la mise à jour des modèles en production
Les garde-fous de déploiement sont un ensemble d'options de déploiement de modèles dans Amazon SageMaker AI Inference pour mettre à jour vos modèles d'apprentissage automatique en production. À l'aide des options de déploiement entièrement gérées, vous pouvez contrôler le passage du modèle actuel en production à un nouveau. Les modes de déplacement du trafic dans les déploiements bleus/verts, tels que canary et linéaire, vous donnent un contrôle précis sur le processus de déplacement du trafic de votre modèle actuel vers le nouveau au cours de la mise à jour. Il existe également des sauvegardes intégrées telles que les restaurations automatiques qui vous aident à détecter les problèmes rapidement et à prendre automatiquement des mesures correctives avant que ces problèmes n'affectent considérablement la production.
Les barrières de protection de déploiement offrent les avantages suivants :
Sécurité de déploiement lors de la mise à jour des environnements de production. Une mise à jour régressive d'un environnement de production peut entraîner des temps d'arrêt imprévus et un impact commercial, tels qu'une latence accrue du modèle et des taux d'erreur élevés. Les barrières de protection de déploiement vous aident à atténuer ces risques en fournissant les bonnes pratiques et des barrières de protection de sécurité opérationnelle intégrées.
Déploiement entièrement géré. SageMaker L'IA se charge de configurer et d'orchestrer ces déploiements et de les intégrer aux mécanismes de mise à jour des terminaux. Vous n'avez pas besoin de créer et de maintenir des mécanismes d'orchestration, de surveillance ou de restauration. Vous pouvez tirer parti de l' SageMaker IA pour configurer et orchestrer ces déploiements et vous concentrer sur l'utilisation du machine learning pour vos applications.
Visibilité. Vous pouvez suivre la progression de votre déploiement via l'DescribeEndpointAPI ou Amazon CloudWatch Events (pour les points de terminaison pris en charge). Pour en savoir plus sur les événements liés à l' SageMaker IA, consultez la section sur le changement d'état de déploiement des terminaux dansÉvénements qu'Amazon SageMaker AI envoie à Amazon EventBridge. Notez que si votre terminal utilise l'une des fonctionnalités de la Exclusions page, vous ne pouvez pas utiliser CloudWatch les événements.
Note
Les barrières de protection de déploiement ne s'appliquent qu'aux types de points de terminaison Inférence asynchrone et Inférence en temps réel.
Comment démarrer
Nous prenons en charge deux types de déploiements pour mettre à jour les modèles en production : les déploiements bleus/verts et les déploiements propagés.
-
Déploiements bleu/vert : vous pouvez déplacer le trafic de votre ancienne flotte (la flotte bleue) vers une nouvelle flotte (flotte verte) avec les mises à jour. Les déploiements bleus/verts offrent plusieurs modes de déplacement du trafic. Un mode de transfert de trafic est une configuration qui indique comment l' SageMaker IA achemine le trafic des terminaux vers une nouvelle flotte contenant vos mises à jour. Les modes de transfert de trafic suivants vous offrent différents niveaux de contrôle sur le processus de mise à jour des points de terminaison :
-
Utilisez le transfert de trafic en une seule fois déplace tout le trafic de vos points de terminaison de la flotte bleue vers la flotte verte. Une fois que le trafic passe à la flotte verte, vos CloudWatch alarmes Amazon prédéfinies commencent à surveiller la flotte verte pendant une durée définie (la période de cuisson). Si aucune alarme ne se déclenche pendant la période de cuisson, l' SageMaker IA met fin à la flotte bleue.
-
Utilisez Canary Traffic Shifting déplace une petite partie de votre trafic (un canary) vers la flotte verte et la surveille pendant une période de préparation. Si le canari réussit sur la flotte verte, l' SageMaker IA déplace le reste du trafic de la flotte bleue vers la flotte verte avant de mettre fin à la flotte bleue.
-
Utiliser le transfert linéaire du trafic déplace encore plus de personnalisation sur le nombre d'étapes de déplacement du trafic et le pourcentage de trafic à déplacer pour chaque étape. Alors que le déplacement Canary vous permet de déplacer le trafic en deux étapes, le déplacement linéaire étend cela à des étapes n espacées linéairement.
-
-
Utilisez des déploiements progressifs: Vous pouvez mettre à jour votre terminal au fur et à mesure que l' SageMaker IA provisionne progressivement la capacité et transfère le trafic vers un nouveau parc par étapes selon la taille de lot que vous spécifiez. Les instances de la nouvelle flotte sont mises à jour avec la nouvelle configuration de déploiement, et si aucune CloudWatch alarme ne se déclenche pendant la période de cuisson, l' SageMaker IA nettoie les instances de l'ancienne flotte. Cette option vous permet de contrôler précisément le nombre d'instances ou le pourcentage de capacité déplacé à chaque étape.
Vous pouvez créer et gérer votre déploiement via l'CreateEndpoint SageMaker API UpdateEndpointet AWS Command Line Interface les commandes. Consultez chacune des pages de déploiement pour plus de détails sur la façon de configurer votre déploiement. Notez que si votre point de terminaison utilise l'une des fonctions répertoriées sur la page Exclusions, vous ne pouvez pas utiliser de barrière de protection de déploiement.
Pour suivre des exemples guidés qui montrent comment utiliser les barrières de protection de déploiement, veuillez consulter nos exemples de blocs-notes Jupyter