Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Automatisches Skalieren Amazon SageMaker Amazon-Modellen
Amazon SageMaker unterstützt die automatische Skalierung (Auto Scaling) für Ihre gehosteten Modelle. Auto Scaling passt dynamisch die Anzahl der Instances an, die für ein Modell als Reaktion auf Workload-Änderungen zur Verfügung gestellt werden. Wenn die Arbeitslast steigt, bringt die automatische Skalierung mehr Instances online. Wenn die Arbeitslast sinkt, werden durch die automatische Skalierung unnötige Instances entfernt, so dass Sie nicht für bereitgestellte Instances zahlen, die Sie nicht nutzen.
Themen
- Überblick über die automatische Skalierung
- Konfigurieren Sie Auto Scaling für Modelle über die Konsole
- Registrieren eines Modells
- Definieren einer Skalierungsrichtlinie
- Anwenden einer Skalierungsrichtlinie
- Skalierungsrichtlinie bearbeiten
- Löschen einer Skalierungsrichtlinie
- Überprüfen Sie den Status einer Skalierungsaktivität, indem Sie die Skalierungsaktivitäten beschreiben
- Lasttest Ihrer Auto -Scaling-Konfiguration
- Wird verwendet AWS CloudFormation , um eine Skalierungsrichtlinie zu erstellen
- Endpunkte aktualisieren oder löschen, die Auto Scaling verwenden