Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Registrieren eines Modells
Bevor Sie Ihrem Modell eine Skalierungsrichtlinie hinzufügen, müssen Sie Ihr Modell zunächst für Auto Scaling registrieren und die Skalierungsgrenzen für das Modell definieren.
Die folgenden Verfahren beschreiben, wie Sie ein Modell (Produktionsvariante) für Auto Scaling mithilfe der API AWS Command Line Interface (AWS CLI) oder Application Auto Scaling registrieren.
Themen
Registrieren eines Modells (AWS CLI)
Verwenden Sie den register-scalable-targetBefehl mit den folgenden Parametern, um Ihre Produktionsvariante zu registrieren:
-
--service-namespace
– Stellen Sie diesen Wert aufsagemaker
ein. -
--resource-id
-Die Ressourcenkennung für das Modell (insbesondere die Produktionsvariante). Für diesen Parameter lautet der Ressourcentypendpoint
und die eindeutige Kennung ist der Name der Produktionsvariante. Beispiel,endpoint/
.my-endpoint
/variant/my-variant
-
--scalable-dimension
-Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCount
ein. -
--min-capacity
— Die Mindestanzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der fürmax-capacity
angegebene Wert. -
--max-capacity
— Die maximale Anzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der fürmin-capacity
angegebene Wert.
Das folgende Beispiel zeigt, wie eine Variante mit dem Namen
, die auf dem my-variant
Endpunkt ausgeführt wird, registriert wird und dynamisch auf eine bis acht Instanzen skaliert werden kann.my-endpoint
aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/
my-endpoint
/variant/my-variant
\ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity1
\ --max-capacity8
Ein Modell registrieren (Application Auto Scaling Anwendungen-API)
Um Ihr Modell bei Application Auto Scaling zu registrieren, verwenden Sie die API-Aktion RegisterScalableTarget Application Auto Scaling mit den folgenden Parametern:
-
ServiceNamespace
– Stellen Sie diesen Wert aufsagemaker
ein. -
ResourceID
-Die Ressourcenkennung für die Produktionsvariante. Für diesen Parameter ist der Ressourcentypendpoint
und die eindeutige Kennung ist der Name der Variante. Zum Beispielendpoint/
.my-endpoint
/variant/my-variant
-
ScalableDimension
– Stellen Sie diesen Wert aufsagemaker:variant:DesiredInstanceCount
ein. -
MinCapacity
— Die Mindestanzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der fürMaxCapacity
angegebene Wert. -
MaxCapacity
— Die maximale Anzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der fürMinCapacity
angegebene Wert.
Das folgende Beispiel zeigt, wie eine Variante mit dem Namen
, die auf dem my-variant
Endpunkt ausgeführt wird, registriert wird und dynamisch skaliert werden kann, sodass sie eine bis acht Instanzen verwendet.my-endpoint
POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/
my-endpoint
/variant/my-variant
", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity":1
, "MaxCapacity":8
}