Überblick über die Pipelines - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Überblick über die Pipelines

Eine SageMaker Amazon-Pipeline besteht aus einer Reihe miteinander verbundener Schritte in gerichtetem azyklischem Graph (DAG), die mithilfe der drag-and-drop Benutzeroberfläche oder Pipelines definiert werden. SDK Sie können Ihre Pipeline auch mithilfe des Pipeline-Definitionsschemas erstellen. JSON Diese DAG JSON Definition enthält Informationen zu den Anforderungen und Beziehungen zwischen den einzelnen Schritten Ihrer Pipeline. Die Struktur einer Pipeline DAG wird durch die Datenabhängigkeiten zwischen den Schritten bestimmt. Diese Datenabhängigkeiten entstehen, wenn die Eigenschaften der Ausgabe eines Schritts als Eingabe an einen anderen Schritt übergeben werden. Das folgende Bild ist ein Beispiel für eine PipelineDAG:

Ein Beispiel für einen durch eine Pipeline gerichteten azyklischen Graphen ()DAG.
Das Beispiel DAG umfasst die folgenden Schritte:
  1. AbaloneProcess, eine Instanz des Verarbeitungsschritts, führt ein Vorverarbeitungsskript für die für das Training verwendeten Daten aus. Das Skript könnte beispielsweise fehlende Werte ausfüllen, numerische Daten normalisieren oder Daten in die Datensätze „Train“, „Validation“ und „Test“ aufteilen.

  2. AbaloneTrain, eine Instanz des Trainingsschritts, konfiguriert Hyperparameter und trainiert ein Modell anhand der vorverarbeiteten Eingabedaten.

  3. AbaloneEval, eine weitere Instanz des Verarbeitungsschritts, bewertet das Modell auf seine Genauigkeit. Dieser Schritt zeigt ein Beispiel für eine Datenabhängigkeit. In diesem Schritt wird die Testdatensatzausgabe von verwendet. AbaloneProcess

  4. AbaloneMSECondist eine Instanz eines Bedingungsschritts, der in diesem Beispiel überprüft, ob das mean-square-error Ergebnis der Modellauswertung unter einem bestimmten Grenzwert liegt. Wenn das Modell die Kriterien nicht erfüllt, wird der Pipelinelauf beendet.

  5. Der Pipelinelauf wird mit den folgenden Schritten fortgesetzt:

    1. AbaloneRegisterModel, wo ein SageMaker RegisterModelSchritt zur Registrierung des Modells als versionierte Modellpaketgruppe in der SageMaker Amazon-Modellregistrierung aufgerufen wird.

    2. AbaloneCreateModel, wobei ein SageMaker CreateModelSchritt zur Erstellung des Modells zur Vorbereitung der Batch-Transformation aufgerufen wird. In SageMaker ruft einen Transform-Schritt aufAbaloneTransform, um Modellvorhersagen für einen von Ihnen angegebenen Datensatz zu generieren.

In den folgenden Themen werden grundlegende Konzepte von Pipelines beschrieben. Ein Tutorial, das die Implementierung dieser Konzepte beschreibt, finden Sie unter Pipelines, Aktionen.