Mettre à jour ou supprimer les points de terminaison qui utilisent la mise à l'échelle automatique - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mettre à jour ou supprimer les points de terminaison qui utilisent la mise à l'échelle automatique

Mettre à jour les points de terminaison qui utilisent la mise à l'échelle automatique

Lorsque vous mettez à jour un point de terminaison, Application Auto Scaling vérifie si l'un des modèles de ce point de terminaison est une cible pour le dimensionnement automatique. Si la mise à jour devait modifier le type d'instance d'un modèle cible pour le dimensionnement automatique, la mise à jour échoue.

Dans le AWS Management Console, vous voyez un avertissement indiquant que vous devez désenregistrer le modèle de la mise à l'échelle automatique avant de pouvoir le mettre à jour. Si vous essayez de mettre à jour le point de terminaison en appelant l'UpdateEndpointAPI, l'appel échoue. Avant de mettre à jour le point de terminaison, supprimez toutes les politiques de dimensionnement configurées pour celui-ci et annulez l'enregistrement de la variante en tant que cible évolutive en appelant l'action API DeregisterScalableTargetApplication Auto Scaling. Après avoir mis à jour le point de terminaison, vous pouvez enregistrer la variante mise à jour en tant que cible évolutive et y associer une politique de dimensionnement.

Il y a une exception. Si vous modifiez le modèle d'une variante configurée pour le dimensionnement automatique, Amazon SageMaker Auto Scaling autorise la mise à jour. Cela est dû au fait que la modification du modèle n'affecte généralement pas suffisamment les performances pour modifier le comportement de dimensionnement. Si vous mettez à jour un modèle pour une variante configurée pour le dimensionnement automatique, assurez-vous que la modification du modèle n'affecte pas de manière significative les performances et le comportement de dimensionnement.

Lorsque vous mettez à jour des SageMaker points de terminaison auxquels le dimensionnement automatique est appliqué, procédez comme suit :

Pour mettre à jour un terminal auquel la mise à l'échelle automatique est appliquée
  1. Désenregistrez le point de terminaison en tant que cible évolutive en appelant. DeregisterScalableTarget

  2. Étant donné que le dimensionnement automatique est bloqué pendant que l'opération de mise à jour est en cours (ou si vous avez désactivé le dimensionnement automatique à l'étape précédente), vous pouvez prendre la précaution supplémentaire d'augmenter le nombre d'instances pour votre terminal lors de la mise à jour. Pour ce faire, mettez à jour le nombre d'instances pour les variantes de production hébergées sur le point de terminaison en appelant UpdateEndpointWeightsAndCapacities.

  3. Appelez DescribeEndpointplusieurs fois jusqu'à ce que la valeur du EndpointStatus champ de réponse soit égale àInService.

  4. Appelez DescribeEndpointConfigpour obtenir les valeurs de la configuration actuelle du point de terminaison.

  5. Créez une nouvelle configuration de point de terminaison en appelant CreateEndpointConfig. Pour les variantes de production pour lesquelles vous souhaitez conserver le nombre ou le poids des instances existantes, utilisez le même nom de variante que celui indiqué DescribeEndpointConfigdans la réponse de l'appel à l'étape précédente. Pour toutes les autres valeurs, utilisez les valeurs que vous avez obtenues comme réponse lorsque vous avez appelé DescribeEndpointConfigà l'étape précédente.

  6. Mettez à jour le point de terminaison en appelant UpdateEndpoint. Spécifiez la configuration du point de terminaison que vous avez créée à l'étape précédente comme champ EndpointConfig. Si vous souhaitez conserver les propriétés de variante telles que le nombre d'instances ou la pondération, définissez la valeur du paramètre RetainAllVariantProperties sur True. Ce paramètre spécifie que les variantes de production portant le même nom seront mises à jour avec le nombre DesiredInstanceCount le plus récent de la réponse de l'appel à DescribeEndpoint, quelles que soient les valeurs du champ InitialInstanceCount dans le nouveau EndpointConfig.

  7. (Facultatif) Réactivez le dimensionnement automatique en appelant RegisterScalableTargetet PutScalingPolicy.

Note

Les étapes 1 et 7 sont obligatoires uniquement si vous mettez à jour un point de terminaison avec les modifications suivantes :

  • Modification du type d'instance pour une variante de production pour laquelle le dimensionnement automatique est configuré

  • Suppression d'une variante de production pour laquelle le dimensionnement automatique est configuré.

Supprimer les points de terminaison configurés pour le dimensionnement automatique

Si vous supprimez un point de terminaison, Application Auto Scaling vérifie si l'un des modèles de ce point de terminaison est une cible pour le dimensionnement automatique. Si c'est le cas et que vous avez l'autorisation d'annuler l'inscription du modèle, Application Auto Scaling annule l'inscription des modèles en tant que cibles évolutives, sans vous en informer. Si vous utilisez une politique d'autorisation personnalisée qui n'autorise pas l'DeregisterScalableTargetaction, vous devez demander l'accès à cette action avant de supprimer le point de terminaison.

Note

En tant qu'utilisateur IAM, il se peut que vous ne disposiez pas des autorisations suffisantes pour supprimer un point de terminaison si un autre utilisateur a configuré le dimensionnement automatique pour une variante de ce point de terminaison.