Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Planen Sie Ihre ML-Workflows
Mit Amazon SageMaker AI können Sie Ihren gesamten ML-Workflow verwalten, indem Sie Datensätze erstellen, Datentransformationen durchführen, Modelle aus Daten erstellen und Ihre Modelle zur Inferenz an Endpunkten bereitstellen. Wenn Sie eine Teilmenge von Schritten Ihres Workflows regelmäßig ausführen, können Sie sich auch dafür entscheiden, diese Schritte nach einem Zeitplan auszuführen. Möglicherweise möchten Sie einen Job in SageMaker Canvas so planen, dass jede Stunde eine Transformation für neue Daten ausgeführt wird. In einem anderen Szenario möchten Sie vielleicht einen wöchentlichen Job planen, um die Modellabweichung Ihres bereitgestellten Modells zu überwachen. Sie können einen wiederkehrenden Zeitplan mit einem beliebigen Zeitintervall angeben — Sie können jede Sekunde, Minute, täglich, wöchentlich, monatlich oder am dritten Freitag eines jeden Monats um 15 Uhr wiederholen.
In den folgenden Szenarien werden die Optionen zusammengefasst, die Ihnen je nach Anwendungsfall zur Verfügung stehen.
Anwendungsfall 1: Erstellen und planen Sie Ihren ML-Workflow in einer Umgebung ohne Code. Für Anfänger oder SageMaker KI-Neulinge können Sie Amazon SageMaker Canvas verwenden, um sowohl Ihren ML-Workflow zu erstellen als auch geplante Läufe mit dem auf der Canvas-Benutzeroberfläche basierenden Scheduler zu erstellen.
Anwendungsfall 2: Erstellen Sie Ihren Workflow in einem einzigen Jupyter-Notebook und verwenden Sie einen No-Code-Scheduler. Erfahrene ML-Praktiker können Code verwenden, um ihren ML-Workflow in einem Jupyter-Notizbuch zu erstellen, und die im Widget „Notizbuchjobs“ verfügbare Planungsoption ohne Code verwenden. Wenn Ihr ML-Workflow aus mehreren Jupyter-Notebooks besteht, können Sie die in Anwendungsfall 3 beschriebene Planungsfunktion im Python-SDK von Pipelines verwenden.
Anwendungsfall 3: Erstellen und planen Sie Ihren ML-Workflow mithilfe von Pipelines. Fortgeschrittene Benutzer können das Amazon SageMaker Python SDK
oder die in Pipelines verfügbaren EventBridge Amazon-Planungsoptionen verwenden. Sie können einen ML-Workflow erstellen, der aus Schritten besteht, die Operationen mit verschiedenen SageMaker KI-Funktionen und AWS -Services wie Amazon EMR beinhalten.
Deskriptor | Anwendungsfall 1 | Anwendungsfall 2 | Anwendungsfall 3 |
---|---|---|---|
SageMaker KI-Funktion | Amazon SageMaker Canvas-Datenverarbeitung und ML-Workflow-Planung | Widget zum Zeitplan für Notebook-Jobs (UI) | Planungsoptionen für das Python-SDK für Pipelines |
Beschreibung | Mit Amazon SageMaker Canvas können Sie automatische Durchläufe von Datenverarbeitungsschritten und in einem separaten Verfahren automatische Datensatzaktualisierungen planen. Sie können Ihren gesamten ML-Workflow auch indirekt planen, indem Sie eine Konfiguration einrichten, die bei jeder Aktualisierung eines bestimmten Datensatzes eine Batch-Vorhersage ausführt. Sowohl für die automatisierte Datenverarbeitung als auch für Datensatzaktualisierungen bietet SageMaker Canvas ein Basisformular, in dem Sie eine Startzeit und ein Startdatum sowie ein Zeitintervall zwischen den Durchläufen auswählen (oder einen Cron-Ausdruck, wenn Sie einen Datenverarbeitungsschritt planen). Weitere Informationen zur Planung von Datenverarbeitungsschritten finden Sie unterErstellen Sie einen Zeitplan für die automatische Verarbeitung neuer Daten. Weitere Informationen zum Planen von Aktualisierungen von Datenmengen und Batchprognosen finden Sie unterWie verwaltet man Automatisierungen. | Wenn Sie Ihren Datenverarbeitungs- und Pipeline-Workflow in einem einzigen Jupyter-Notizbuch erstellt haben, können Sie das Widget Notizbuchjobs verwenden, um Ihr Notizbuch bei Bedarf oder nach einem Zeitplan auszuführen. Das Widget „Notizbuchjobs“ zeigt ein einfaches Formular an, in dem Sie den Berechnungstyp, den Ausführungsplan und optionale benutzerdefinierte Einstellungen angeben. Sie definieren Ihren Ausführungsplan, indem Sie ein zeitbasiertes Intervall auswählen oder einen Cron-Ausdruck einfügen. Das Widget wird automatisch in Studio installiert, oder Sie können eine zusätzliche Installation durchführen, um diese Funktion in Ihrer lokalen Umgebung zu verwenden. JupyterLab Weitere Informationen zu Notebook-Jobs finden Sie unterSageMaker Notizbuch-Jobs. | Sie können die Planungsfunktionen im SageMaker AI SDK verwenden, wenn Sie Ihren ML-Workflow mit Pipelines implementiert haben. Ihre Pipeline kann Schritte wie Feinabstimmung, Datenverarbeitung und Bereitstellung umfassen. Pipelines unterstützt zwei Möglichkeiten, Ihre Pipeline zu planen. Sie können eine EventBridge Amazon-Regel erstellen oder den SageMaker AI PipelineSchedule |
Optimiert für | Bietet eine Planungsoption für einen SageMaker Canvas-ML-Workflow | Bietet eine UI-basierte Planungsoption für Jupyter-Notebook-basierte ML-Workflows | Bietet ein SageMaker KI-SDK oder eine Planungsoption für ML-Workflows EventBridge |
Überlegungen | Sie können Ihren Workflow mit dem Canvas-Framework ohne Code planen, aber Datensatzaktualisierungen und Batch-Transformationsaktualisierungen können bis zu 5 GB an Daten verarbeiten. | Sie können ein Notizbuch mit dem auf der Benutzeroberfläche basierenden Terminplanungsformular planen, aber nicht mehrere Notizbücher für denselben Job. Verwenden Sie die in Anwendungsfall 3 beschriebene codebasierte Pipelines SDK-Lösung, um mehrere Notizbücher zu planen. | Sie können die fortschrittlicheren (SDK-basierten) Planungsfunktionen von Pipelines verwenden. Sie müssen jedoch auf die API-Dokumentation zurückgreifen, um die richtigen Optionen anzugeben, anstatt aus einem auf der Benutzeroberfläche basierenden Optionsmenü auszuwählen. |
Empfohlene Umgebung | Amazon SageMaker Leinwand | Studio, lokale JupyterLab Umgebung | Studio, lokale JupyterLab Umgebung, beliebiger Code-Editor |
Weitere Ressourcen
SageMaker KI bietet die folgenden zusätzlichen Optionen für die Planung Ihrer Workflows.
Was ist Amazon EventBridge Scheduler? . Die in diesem Abschnitt erörterten Planungsoptionen umfassen vorgefertigte Optionen, die in SageMaker Canvas, Studio und dem SageMaker AI Python SDK verfügbar sind. Alle Optionen erweitern die Funktionen von Amazon EventBridge, und Sie können damit auch Ihre eigene benutzerdefinierte Planungslösung erstellen EventBridge.
Geplante und ereignisbasierte Ausführungen für Feature-Prozessor-Pipelines. Mit Amazon SageMaker Feature Store Feature Processing können Sie Ihre Feature Processing-Pipelines so konfigurieren, dass sie nach einem Zeitplan oder als Ergebnis eines anderen AWS Serviceereignisses ausgeführt werden.