Prérequis pour le dimensionnement automatique - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Prérequis pour le dimensionnement automatique

Avant de pouvoir utiliser la mise à l'échelle automatique, vous devez déjà avoir créé un point de terminaison du modèle Amazon SageMaker AI. Vous pouvez avoir plusieurs versions de modèles pour le même point de terminaison. Chaque modèle est appelé variante de production (modèle). Pour plus d'informations sur le déploiement d'un point de terminaison de modèle, consultez Déployer le modèle sur les services d'hébergement SageMaker AI.

Pour activer le dimensionnement automatique d'un modèle, vous pouvez utiliser la console SageMaker AI, le AWS Command Line Interface (AWS CLI) ou un AWS SDK via l'API Application Auto Scaling.

  • Si c'est la première fois que vous configurez le dimensionnement d'un modèle, nous vous recommandons de le faireConfiguration de la mise à l'échelle automatique d'un modèle avec la console.

  • Lorsque vous utilisez l'API Application Auto Scaling AWS CLI ou l'API Application Auto Scaling, le flux consiste à enregistrer le modèle en tant que cible évolutive, à définir la politique de dimensionnement, puis à l'appliquer. Sur la console SageMaker AI, sous Inference dans le volet de navigation, sélectionnez Endpoints. Recherchez le nom du point de terminaison de votre modèle, puis choisissez-le pour trouver le nom de la variante. Vous devez spécifier à la fois le nom du point de terminaison et le nom de la variante pour activer le dimensionnement automatique d'un modèle.

Le dimensionnement automatique est rendu possible par la combinaison d'Amazon SageMaker AI, d'Amazon CloudWatch et d'Application Auto Scaling APIs. Pour plus d'informations sur les autorisations minimales requises, consultez les exemples de politiques basées sur l'identité d'Application Auto Scaling dans le Guide de l'utilisateur d'Application Auto Scaling.

La politique SagemakerFullAccessPolicy IAM dispose de toutes les autorisations IAM requises pour effectuer un dimensionnement automatique. Pour plus d'informations sur les autorisations SageMaker AI IAM, consultezComment utiliser les rôles d'exécution de l' SageMaker IA.

Si vous gérez votre propre politique d'autorisation, vous devez inclure les autorisations suivantes :

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "sagemaker:DescribeEndpoint", "sagemaker:DescribeEndpointConfig", "sagemaker:UpdateEndpointWeightsAndCapacities" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "application-autoscaling:*" ], "Resource": "*" }, { "Effect": "Allow", "Action": "iam:CreateServiceLinkedRole", "Resource": "arn:aws:iam::*:role/aws-service-role/sagemaker.application-autoscaling.amazonaws.com/AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint", "Condition": { "StringLike": { "iam:AWSServiceName": "sagemaker.application-autoscaling.amazonaws.com" } } }, { "Effect": "Allow", "Action": [ "cloudwatch:PutMetricAlarm", "cloudwatch:DescribeAlarms", "cloudwatch:DeleteAlarms" ], "Resource": "*" } ] }

Rôle lié à un service

Auto Scaling utilise le rôle AWSServiceRoleForApplicationAutoScaling_SageMakerEndpoint lié au service. Ce rôle lié au service accorde à Application Auto Scaling l'autorisation de décrire les alarmes correspondant à vos politiques, de surveiller les niveaux de capacité actuels et de dimensionner la ressource cible. Ce rôle est créé automatiquement pour vous. Pour que la création automatique des rôles réussisse, vous devez être autorisé à effectuer l'iam:CreateServiceLinkedRoleaction. Pour plus d’informations, consultez Rôles liés à un service dans le Guide de l’utilisateur Application Auto Scaling.