Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

Konfigurieren Sie Auto Scaling für Modelle über die Konsole

Fokusmodus
Konfigurieren Sie Auto Scaling für Modelle über die Konsole - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So konfigurieren Sie Auto Scaling für ein Modell (Konsole)
  1. Öffnen Sie die Amazon SageMaker AI-Konsole unter https://console.aws.amazon.com/sagemaker/.

  2. Wählen Sie im Navigationsbereich Inference und dann Endpoints aus.

  3. Wählen Sie Ihren Endpunkt und dann für Endpoint Runtime Settings die Variante aus.

  4. Wählen Sie Configure auto scaling (Auto Scaling konfigurieren) aus.

  5. Gehen Sie auf der Seite Automatische Variantenskalierung konfigurieren für Automatische Variantenskalierung wie folgt vor:

    1. Geben Sie für Minimale Instanzanzahl die Mindestanzahl von Instances ein, die die Skalierungsrichtlinie beibehalten soll. Es ist mindestens eine Instance erforderlich.

    2. Geben Sie für Maximale Anzahl von Instanzen die maximale Anzahl von Instances ein, die die Skalierungsrichtlinie beibehalten soll.

  6. Gehen Sie für die integrierte Skalierungsrichtlinie wie folgt vor:

    1. Wird für die Ziel-Metrik automatisch für die Metrik ausgewählt und kann nicht geändert werden. SageMakerVariantInvocationsPerInstance

    2. Geben Sie für den Zielwert die durchschnittliche Anzahl von Aufrufen pro Instanz und Minute für das Modell ein. Um diesen Wert festzulegen, befolgen Sie die Richtlinien auf Lasttest.

    3. (Optional) Geben Sie für Scale-in-Cooldown (Sekunden) und Scale-Out-Cooldown (Sekunden) die Zeitdauer in Sekunden für jede Abkühlphase ein.

    4. (Optional) Wählen Sie Skalierung deaktivieren aus, wenn Sie nicht möchten, dass Auto Scaling Instances beendet, wenn der Traffic abnimmt.

  7. Wählen Sie Save (Speichern) aus.

Dieses Verfahren registriert ein Modell als skalierbares Ziel mit Application Auto Scaling. Wenn Sie ein Modell registrieren, nimmt Application Auto Scaling Überprüfungen vor, um sicherzustellen, dass:

  • Das Modell existiert

  • die Berechtigungen ausreichen

  • Sie keine Variante mit einer Instance registrieren, die eine Burstable Performance Instance wie T2 ist

    Anmerkung

    SageMaker KI unterstützt Auto Scaling für Burstable-Instances wie T2 nicht, da sie bereits eine höhere Kapazität bei erhöhten Workloads ermöglichen. Informationen zu Burstable-Performance-Instances finden Sie unter EC2 Amazon-Instance-Typen.

DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.