Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Anwenden einer Skalierungsrichtlinie
Nachdem Sie Ihr Modell registriert und eine Skalierungsrichtlinie definiert haben, wenden Sie die Skalierungsrichtlinie auf das registrierte Modell an. In diesem Abschnitt wird gezeigt, wie Sie eine Skalierungsrichtlinie mithilfe von AWS Command Line Interface (AWS CLI) oder Application Auto Scaling anwendenAPI.
Themen
Wenden Sie eine Skalierungsrichtlinie für die Zielverfolgung an (AWS CLI)
Verwenden Sie den put-scaling-policy AWS CLI Befehl mit den folgenden Parametern, um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden:
-
--policy-name
– Der Name der Skalierungsrichtlinie. -
--policy-type
-Stellen Sie diesen Wert aufTargetTrackingScaling
ein. -
--resource-id
- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpoint
und die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/
.my-endpoint
/variant/my-variant
-
--service-namespace
-Stellen Sie diesen Wert aufsagemaker
ein. -
--scalable-dimension
-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCount
ein. -
--target-tracking-scaling-policy-configuration
— Die Konfiguration der Skalierungsrichtlinie zur Zielverfolgung, die für das Modell verwendet werden soll.
Im folgenden Beispiel wird eine benannte Skalierungsrichtlinie für die Zielverfolgung auf eine Variante mit
dem Namen, die auf dem my-scaling-policy
my-variant
Endpunkt ausgeführt wird, angewendet. Geben Sie für die my-endpoint
--target-tracking-scaling-policy-configuration
Option die config.json
Datei an, die Sie zuvor erstellt haben.
aws application-autoscaling put-scaling-policy \ --policy-name
my-scaling-policy
\ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint
/variant/my-variant
\ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json
Wenden Sie eine Skalierungsrichtlinie an (Application Auto ScalingAPI)
Um eine Skalierungsrichtlinie auf eine Variante mit Application Auto Scaling anzuwendenAPI, verwenden Sie die PutScalingPolicyApplication Auto Scaling API Scaling-Aktion mit den folgenden Parametern:
-
PolicyName
– Der Name der Skalierungsrichtlinie. -
ServiceNamespace
-Stellen Sie diesen Wert aufsagemaker
ein. -
ResourceID
- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentypendpoint
und die eindeutige Kennung ist der Name der Variante. Beispiel,endpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCount
ein. -
PolicyType
-Stellen Sie diesen Wert aufTargetTrackingScaling
ein. -
TargetTrackingScalingPolicyConfiguration
-Die für die Variante zu verwendende Konfiguration der Skalierungsrichtlinie für die Zielverfolgung.
Im folgenden Beispiel wird eine benannte Skalierungsrichtlinie für die Zielverfolgung
auf eine Variante mit dem Namenmy-scaling-policy
, die auf dem my-variant
Endpunkt ausgeführt wird, angewendet. Die Richtlinienkonfiguration hält die durchschnittlichen Aufrufe pro Instanz bei 70.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "
my-scaling-policy
", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue":70.0
, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }