Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Einsatzleitplanken für die Aktualisierung von Modellen in der Produktion
Deployment Guardrails sind eine Reihe von Modellbereitstellungsoptionen in Amazon SageMaker Inference, mit denen Sie Ihre Machine-Learning-Modelle in der Produktion aktualisieren können. Mithilfe der vollständig verwalteten Bereitstellungsoptionen können Sie den Wechsel vom aktuellen Modell in der Produktion zu einem neuen steuern. Die Modi zur Verkehrsverlagerung in blauen/grünen Bereitstellungen, wie z. B. Canary und Linear, geben Ihnen eine detaillierte Kontrolle über den Prozess der Verkehrsverlagerung von Ihrem aktuellen Modell auf das neue Modell im Laufe des Updates. Darüber hinaus gibt es integrierte Schutzmechanismen wie z. B. automatische Rollbacks, die Ihnen helfen, Probleme frühzeitig zu erkennen und automatisch Korrekturmaßnahmen zu ergreifen, bevor sie die Produktion erheblich beeinträchtigen.
Einsatzleitplanken bieten die folgenden Vorteile:
Sicherheit bei der Bereitstellung bei gleichzeitiger Aktualisierung der Produktionsumgebungen. Eine regressive Aktualisierung einer Produktionsumgebung kann zu ungeplanten Ausfallzeiten und geschäftlichen Auswirkungen führen, z. B. zu einer erhöhten Modelllatenz und hohen Fehlerraten. Leitplanken für die Implementierung helfen Ihnen, diese Risiken zu minimieren, indem sie bewährte Verfahren und integrierte Sicherheitsleitplanken bereitstellen.
Vollständig verwaltete Bereitstellung. SageMaker kümmert sich um die Einrichtung und Orchestrierung dieser Bereitstellungen und integriert sie in die Aktualisierungsmechanismen für Endgeräte. Sie müssen keine Orchestrierungs-, Überwachungs- oder Rollback-Mechanismen entwickeln und verwalten. Sie können diese Bereitstellungen einrichten und orchestrieren und sich darauf konzentrieren, ML für Ihre Anwendungen zu nutzen. SageMaker
Sichtbarkeit. Sie können den Fortschritt Ihrer Bereitstellung über DescribeEndpointAPIoder über Amazon CloudWatch Events (für unterstützte Endpunkte) verfolgen. Weitere Informationen zu Ereignissen in finden Sie im SageMaker Abschnitt Änderung des Bereitstellungsstatus von Endgeräten unterEreignisse, die Amazon SageMaker an Amazon sendet EventBridge. Beachten Sie, dass Sie CloudWatch Ereignisse nicht verwenden können, wenn Ihr Endpunkt eine der Funktionen Ausschlüsse auf der Seite verwendet.
Anmerkung
Leitplanken für die Bereitstellung gelten nur für Endpunkttypen Asynchrone Inferenz-Inferenz und Echtzeit-Inferenz.
Erste Schritte
Wir unterstützen zwei Arten von Bereitstellungen zur Aktualisierung von Modellen in der Produktion: Bereitstellungen mit Blau/Grün und fortlaufende Bereitstellungen.
-
Blau/Grün-Bereitstellungen: Mit den Updates können Sie den Verkehr von Ihrer alten Flotte (der blauen Flotte) auf eine neue Flotte (grüne Flotte) verlagern. Blaue/grüne Bereitstellungen bieten mehrere Modi zur Verkehrsverlagerung. Ein Verkehrsverlagerungsmodus ist eine Konfiguration, die festlegt, wie der SageMaker Endpunktverkehr an eine neue Flotte weitergeleitet wird, die Ihre Updates enthält. Die folgenden Modi zur Verkehrsverlagerung bieten Ihnen unterschiedliche Kontrollmöglichkeiten für den Endpunkt-Aktualisierungsprozess:
-
Verwenden Sie Traffic Shifting auf einmal verlagert Ihren gesamten Endpunktverkehr von der blauen Flotte auf die grüne Flotte. Sobald der Verkehr auf die grüne Flotte umgestellt wird, beginnen Ihre vordefinierten CloudWatch Amazon-Alarme damit, die grüne Flotte für einen bestimmten Zeitraum (die Backphase) zu überwachen. Wenn während der Backphase keine Alarme ausgelöst werden, wird die blaue SageMaker Flotte beendet.
-
Nutze Canary Traffic Shifting verlagert einen kleinen Teil Ihres Traffics (ein Canary) auf die grüne Flotte und überwacht diese während einer Backphase. Wenn der Kanarienvogel bei der grünen Flotte erfolgreich ist, SageMaker verlagert er den Rest des Verkehrs von der blauen Flotte auf die grüne Flotte, bevor die blaue Flotte beendet wird.
-
Verwenden Sie lineare Verkehrsverlagerung bietet noch mehr Anpassungsmöglichkeiten in Bezug auf die Anzahl der Schritte zur Verkehrsverlagerung und den Prozentsatz des Verkehrs, der für jeden Schritt verlagert werden muss. Mit Canary Shifting können Sie den Verkehr zwar in zwei Schritten verlagern, bei linearem Shifting wird dies jedoch auf n linear verteilte Schritte ausgedehnt.
-
-
Verwenden Sie fortlaufende Bereitstellungen: Sie können Ihren Endpunkt aktualisieren, indem die Kapazität SageMaker schrittweise bereitgestellt und der Verkehr in Schritten einer von Ihnen angegebenen Batchgröße auf eine neue Flotte verlagert wird. Die Instanzen auf der neuen Flotte werden mit der neuen Bereitstellungskonfiguration aktualisiert. Wenn während der Backphase keine CloudWatch Alarme ausgelöst werden, werden die Instanzen auf der alten Flotte SageMaker bereinigt. Mit dieser Option haben Sie die genaue Kontrolle über die Anzahl der Instances oder den Kapazitätsprozentsatz, der bei jedem Schritt verschoben wurde.
Sie können Ihr Deployment mit den AWS Command Line Interface Befehlen und und erstellen UpdateEndpointCreateEndpoint SageMaker APIund verwalten. Weitere Informationen zur Einrichtung Ihrer Bereitstellung finden Sie auf den einzelnen Bereitstellungsseiten. Beachten Sie, dass Sie keine Bereitstellungsleitlinien verwenden können, wenn Ihr Endpunkt eine der auf der Ausschlüsse Seite aufgeführten Features verwendet.
Anleitungen zur Verwendung von Deployment Guardrails finden Sie in unseren Beispiel-Jupyter Notebooks