Modelle in der Produktion aktualisieren - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Modelle in der Produktion aktualisieren

Bereitstellungsleitplanken sind eine Reihe von Optionen zur Modellbereitstellung in Amazon SageMaker Inference, um Ihre Machine-Learning-Modelle in der Produktion zu aktualisieren. Mithilfe der vollständig verwalteten Bereitstellungsoptionen können Sie den Wechsel vom aktuellen Modell in der Produktion zu einem neuen steuern. Die Modi zur Verkehrsverlagerung in blauen/grünen Bereitstellungen, wie z. B. Canary und Linear, geben Ihnen eine detaillierte Kontrolle über den Prozess der Verkehrsverlagerung von Ihrem aktuellen Modell auf das neue Modell im Laufe des Updates. Darüber hinaus gibt es integrierte Schutzmechanismen wie z. B. automatische Rollbacks, die Ihnen helfen, Probleme frühzeitig zu erkennen und automatisch Korrekturmaßnahmen zu ergreifen, bevor sie die Produktion erheblich beeinträchtigen.

Einsatzleitplanken bieten die folgenden Vorteile:

  • Sicherheit bei der Bereitstellung bei gleichzeitiger Aktualisierung der Produktionsumgebungen. Eine regressive Aktualisierung einer Produktionsumgebung kann zu ungeplanten Ausfallzeiten und geschäftlichen Auswirkungen führen, z. B. zu einer erhöhten Modelllatenz und hohen Fehlerraten. Leitplanken für die Implementierung helfen Ihnen, diese Risiken zu minimieren, indem sie bewährte Verfahren und integrierte Sicherheitsleitplanken bereitstellen.

  • Vollständig verwaltete Bereitstellung. SageMaker kümmert sich um die Einrichtung und Orchestrierung dieser Bereitstellungen und integriert sie in Mechanismen zur Endpunktaktualisierung. Sie müssen keine Orchestrierungs-, Überwachungs- oder Rollback-Mechanismen entwickeln und verwalten. Sie können nutzen SageMaker , um diese Bereitstellungen einzurichten und zu orchestrieren und sich auf die Nutzung von ML für Ihre Anwendungen zu konzentrieren.

  • Sichtbarkeit. Sie können den Fortschritt Ihrer Bereitstellung über die DescribeEndpoint API oder über Amazon CloudWatch Events (für unterstützte Endpunkte ) verfolgen. Weitere Informationen zu Ereignissen in SageMakerfinden Sie im Abschnitt Statusänderung der Endpunktbereitstellung in Amazon SageMaker mit Amazon automatisieren EventBridge. Beachten Sie, dass Sie CloudWatch Ereignisse nicht verwenden können, wenn Ihr Endpunkt eine der Funktionen auf der Ausschlüsse Seite verwendet.

Anmerkung

Leitplanken für die Bereitstellung gelten nur für Endpunkttypen Asynchrone Inferenz-Inferenz und Echtzeit-Inferenz.

Erste Schritte

Wir unterstützen zwei Arten von Bereitstellungen zur Aktualisierung von Modellen in der Produktion: Bereitstellungen mit Blau/Grün und fortlaufende Bereitstellungen.

  • Blau/Grün-Bereitstellungen: Mit den Updates können Sie den Verkehr von Ihrer alten Flotte (der blauen Flotte) auf eine neue Flotte (grüne Flotte) verlagern. Blaue/grüne Bereitstellungen bieten mehrere Modi zur Verkehrsverlagerung. Ein Modus der Verkehrsverlagerung ist eine Konfiguration, die angibt, wie Endpunktdatenverkehr an eine neue Flotte SageMaker weiterleitet, die Ihre Updates enthält. Die folgenden Modi zur Verkehrsverlagerung bieten Ihnen unterschiedliche Kontrollmöglichkeiten für den Endpunkt-Aktualisierungsprozess:

    • Verkehrsverlagerung auf einmal verlagert Ihren gesamten Endpunktverkehr von der blauen Flotte auf die grüne Flotte. Sobald der Datenverkehr auf die grüne Flotte verlagert ist, beginnen Ihre vordefinierten Amazon- CloudWatch Alarme mit der Überwachung der grünen Flotte für einen bestimmten Zeitraum (die Backphase ). Wenn während der Backphase keine Alarme ausgelöst werden, SageMaker beendet die blaue Flotte.

    • Verkehrsverlagerung auf die Kanaren verlagert einen kleinen Teil Ihres Traffics (ein Canary) auf die grüne Flotte und überwacht diese während einer Backphase. Wenn der Canary auf der grünen Flotte erfolgreich ist, SageMaker verschiebt den Rest des Datenverkehrs von der blauen Flotte auf die grüne Flotte, bevor die blaue Flotte beendet wird.

    • Lineare Verkehrsverlagerung bietet noch mehr Anpassungsmöglichkeiten in Bezug auf die Anzahl der Schritte zur Verkehrsverlagerung und den Prozentsatz des Verkehrs, der für jeden Schritt verlagert werden muss. Mit Canary Shifting können Sie den Verkehr zwar in zwei Schritten verlagern, bei linearem Shifting wird dies jedoch auf n linear verteilte Schritte ausgedehnt.

  • Fortlaufende Bereitstellungen: Sie können Ihren Endpunkt aktualisieren, indem Sie SageMaker inkrementell Kapazität bereitstellen und den Datenverkehr in Schritten einer von Ihnen angegebenen Batchgröße auf eine neue Flotte verlagern. Instances auf der neuen Flotte werden mit der neuen Bereitstellungskonfiguration aktualisiert. Wenn während der Backphase keine CloudWatch Alarme ausgelöst werden, SageMaker bereinigt Instances auf der alten Flotte. Mit dieser Option haben Sie die genaue Kontrolle über die Anzahl der Instances oder den Kapazitätsprozentsatz, der bei jedem Schritt verschoben wurde.

Sie können Ihre Bereitstellung über die - UpdateEndpoint und CreateEndpoint SageMaker -API- AWS Command Line Interface Befehle und erstellen und verwalten. Weitere Informationen zur Einrichtung Ihrer Bereitstellung finden Sie auf den einzelnen Bereitstellungsseiten. Beachten Sie, dass Sie keine Bereitstellungsleitlinien verwenden können, wenn Ihr Endpunkt eine der auf der Ausschlüsse Seite aufgeführten Features verwendet.

Anleitungen zur Verwendung von Deployment Guardrails finden Sie in unseren Beispiel-Jupyter Notebooks für die Modi Canary und Linear Traffic Shifting.