Anwenden einer Skalierungsrichtlinie - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Anwenden einer Skalierungsrichtlinie

Nachdem Sie Ihr Modell registriert und eine Skalierungsrichtlinie definiert haben, wenden Sie die Skalierungsrichtlinie auf das registrierte Modell an. In diesem Abschnitt wird gezeigt, wie Sie eine Skalierungsrichtlinie mithilfe der AWS Command Line Interface (AWS CLI) oder der Application Auto Scaling Scaling-API anwenden.

Wenden Sie eine Skalierungsrichtlinie für die Zielverfolgung an (AWS CLI)

Verwenden Sie den put-scaling-policy AWS CLI Befehl mit den folgenden Parametern, um eine Skalierungsrichtlinie auf Ihr Modell anzuwenden:

  • --policy-name – Der Name der Skalierungsrichtlinie.

  • --policy-type-Stellen Sie diesen Wert auf TargetTrackingScaling ein.

  • --resource-id- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. z. B. endpoint/my-endpoint/variant/my-variant.

  • --service-namespace-Stellen Sie diesen Wert auf sagemaker ein.

  • --scalable-dimension-Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • --target-tracking-scaling-policy-configuration— Die Konfiguration der Skalierungsrichtlinie zur Zielverfolgung, die für das Modell verwendet werden soll.

Im folgenden Beispiel wird eine benannte Skalierungsrichtlinie für die Zielverfolgung auf eine Variante mit my-scaling-policy dem Namen, die auf dem my-variant my-endpoint Endpunkt ausgeführt wird, angewendet. Geben Sie für die --target-tracking-scaling-policy-configuration Option die config.json Datei an, die Sie zuvor erstellt haben.

aws application-autoscaling put-scaling-policy \ --policy-name my-scaling-policy \ --policy-type TargetTrackingScaling \ --resource-id endpoint/my-endpoint/variant/my-variant \ --service-namespace sagemaker \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --target-tracking-scaling-policy-configuration file://config.json

Wenden Sie eine Skalierungsrichtlinie an (Application Auto Scaling API)

Um eine Skalierungsrichtlinie auf eine Variante mit der Application Auto Scaling API anzuwenden, verwenden Sie die PutScalingPolicyApplication Auto Scaling API-Aktion mit den folgenden Parametern:

  • PolicyName – Der Name der Skalierungsrichtlinie.

  • ServiceNamespace-Stellen Sie diesen Wert auf sagemaker ein.

  • ResourceID- Die Ressourcenkennung für die Variante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. z. B. endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension-Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • PolicyType-Stellen Sie diesen Wert auf TargetTrackingScaling ein.

  • TargetTrackingScalingPolicyConfiguration-Die für die Variante zu verwendende Konfiguration der Skalierungsrichtlinie für die Zielverfolgung.

Im folgenden Beispiel wird eine benannte Skalierungsrichtlinie für die Zielverfolgung my-scaling-policy auf eine Variante mit dem Namen angewendetmy-variant, die auf dem my-endpoint Endpunkt ausgeführt wird. Die Richtlinienkonfiguration hält die durchschnittlichen Aufrufe pro Instanz bei 70.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService. X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "PolicyName": "my-scaling-policy", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "PolicyType": "TargetTrackingScaling", "TargetTrackingScalingPolicyConfiguration": { "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" } } }