Registrieren eines Modells - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Registrieren eines Modells

Bevor Sie Ihrem Modell eine Skalierungsrichtlinie hinzufügen, müssen Sie Ihr Modell zunächst für Auto Scaling registrieren und die Skalierungsgrenzen für das Modell definieren.

Die folgenden Verfahren beschreiben, wie Sie ein Modell (Produktionsvariante) für Auto Scaling mithilfe der API AWS Command Line Interface (AWS CLI) oder Application Auto Scaling registrieren.

Registrieren eines Modells (AWS CLI)

Verwenden Sie den register-scalable-targetBefehl mit den folgenden Parametern, um Ihre Produktionsvariante zu registrieren:

  • --service-namespace – Stellen Sie diesen Wert auf sagemaker ein.

  • --resource-id-Die Ressourcenkennung für das Modell (insbesondere die Produktionsvariante). Für diesen Parameter lautet der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Produktionsvariante. Beispiel, endpoint/my-endpoint/variant/my-variant.

  • --scalable-dimension-Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • --min-capacity— Die Mindestanzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der für max-capacity angegebene Wert.

  • --max-capacity— Die maximale Anzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der für min-capacity angegebene Wert.

Das folgende Beispiel zeigt, wie eine Variante mit dem Namenmy-variant, die auf dem my-endpoint Endpunkt ausgeführt wird, registriert wird und dynamisch auf eine bis acht Instanzen skaliert werden kann.

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

Ein Modell registrieren (Application Auto Scaling Anwendungen-API)

Um Ihr Modell bei Application Auto Scaling zu registrieren, verwenden Sie die API-Aktion RegisterScalableTarget Application Auto Scaling mit den folgenden Parametern:

  • ServiceNamespace – Stellen Sie diesen Wert auf sagemaker ein.

  • ResourceID-Die Ressourcenkennung für die Produktionsvariante. Für diesen Parameter ist der Ressourcentyp endpoint und die eindeutige Kennung ist der Name der Variante. Zum Beispiel endpoint/my-endpoint/variant/my-variant.

  • ScalableDimension – Stellen Sie diesen Wert auf sagemaker:variant:DesiredInstanceCount ein.

  • MinCapacity— Die Mindestanzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder kleiner sein als der für MaxCapacity angegebene Wert.

  • MaxCapacity— Die maximale Anzahl von Instanzen. Dieser Wert muss auf mindestens 1 gesetzt werden und muss gleich oder größer sein als der für MinCapacity angegebene Wert.

Das folgende Beispiel zeigt, wie eine Variante mit dem Namenmy-variant, die auf dem my-endpoint Endpunkt ausgeführt wird, registriert wird und dynamisch skaliert werden kann, sodass sie eine bis acht Instanzen verwendet.

POST / HTTP/1.1 Host: application-autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20230506T182145Z User-Agent: aws-cli/2.0.0 Python/3.7.5 Windows/10 botocore/2.0.0dev4 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }