Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Application d'une stratégie de mise à l'échelle
Après avoir enregistré votre modèle et défini une politique de dimensionnement, appliquez la politique de dimensionnement au modèle enregistré. Cette section explique comment appliquer une politique de dimensionnement à l'aide du AWS Command Line Interface (AWS CLI) ou de l'Application Auto ScalingAPI.
Rubriques
Appliquer une politique de dimensionnement du suivi des cibles (AWS CLI)
Pour appliquer une politique de dimensionnement à votre modèle, utilisez la put-scaling-policy AWS CLI commande avec les paramètres suivants :
-
--policy-name
Nom de la stratégie de mise à l'échelle. -
--policy-type
-Définissez cette valeur surTargetTrackingScaling
. -
--resource-id
- L'identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource estendpoint
et l'identifiant unique est le nom de la variante. Par exemple,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
-Définissez cette valeur sursagemaker
. -
--scalable-dimension
-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount
. -
--target-tracking-scaling-policy-configuration
: configuration de la politique de dimensionnement du suivi des cibles à utiliser pour le modèle.
L'exemple suivant applique une politique de dimensionnement du suivi des cibles nommée
à une variante nomméemy-scaling-policy
, exécutée sur le my-variant
point de terminaison. Pour l'my-endpoint
--target-tracking-scaling-policy-configuration
option, spécifiez le config.json
fichier que vous avez créé précédemment.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Appliquer une politique de dimensionnement (Application Auto ScalingAPI)
Pour appliquer une politique de dimensionnement à une variante avec Application Auto ScalingAPI, utilisez l'APIaction PutScalingPolicyApplication Auto Scaling avec les paramètres suivants :
-
PolicyName
Nom de la stratégie de mise à l'échelle. -
ServiceNamespace
-Définissez cette valeur sursagemaker
. -
ResourceID
- L'identifiant de la ressource pour la variante. Pour ce paramètre, le type de ressource estendpoint
et l'identifiant unique est le nom de la variante. Par exemple,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
-Définissez cette valeur sursagemaker:variant:DesiredInstanceCount
. -
PolicyType
-Définissez cette valeur surTargetTrackingScaling
. -
TargetTrackingScalingPolicyConfiguration
: la configuration de la politique de mise à l'échelle avec suivi des cibles à utiliser pour la variante.
L'exemple suivant applique une politique de dimensionnement du suivi des cibles nommée
à une variante nomméemy-scaling-policy
, exécutée sur le my-variant
point de terminaison. La configuration de la politique maintient le nombre moyen d'appels par instance à 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }