Vue d'ensemble des pipelines - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vue d'ensemble des pipelines

Un SageMaker pipeline Amazon est une série d'étapes interconnectées dans un graphe acyclique dirigé (DAG) qui sont définies à l'aide de l' drag-and-dropinterface utilisateur ou de Pipelines SDK. Vous pouvez également créer votre pipeline à l'aide du JSONschéma de définition du pipeline. Cette DAG JSON définition fournit des informations sur les exigences et les relations entre chaque étape de votre pipeline. La structure d'un pipeline DAG est déterminée par les dépendances des données entre les étapes. Ces dépendances de données sont créées lorsque les propriétés de la sortie d'une étape sont passées en tant qu'entrée à une autre étape. L'image suivante est un exemple de pipeline DAG :

Exemple de graphe acyclique dirigé par pipeline (DAG).
L'exemple DAG inclut les étapes suivantes :
  1. AbaloneProcess, une instance de l'étape Traitement, exécute un script de prétraitement sur les données utilisées pour l'entraînement. Par exemple, le script peut remplir les valeurs manquantes, normaliser les données numériques ou diviser les données entre les ensembles de données de train, de validation et de test.

  2. AbaloneTrain, une instance de l'étape d'apprentissage, configure les hyperparamètres et entraîne un modèle à partir des données d'entrée prétraitées.

  3. AbaloneEval, une autre instance de l'étape Traitement, évalue la précision du modèle. Cette étape montre un exemple de dépendance des données. Cette étape utilise la sortie de l'ensemble de données de test du. AbaloneProcess

  4. AbaloneMSECondest une instance d'une étape Condition qui, dans cet exemple, vérifie que le mean-square-error résultat de l'évaluation du modèle est inférieur à une certaine limite. Si le modèle ne répond pas aux critères, l'exécution du pipeline s'arrête.

  5. L'exécution du pipeline se déroule selon les étapes suivantes :

    1. AbaloneRegisterModel, où SageMaker appelle une RegisterModelétape pour enregistrer le modèle en tant que groupe de packages de modèles versionnés dans l'Amazon SageMaker Model Registry.

    2. AbaloneCreateModel, où SageMaker appelle une CreateModelétape de création du modèle en vue de la transformation par lots. InAbaloneTransform, SageMaker appelle une étape de transformation pour générer des prédictions de modèle sur un jeu de données que vous spécifiez.

Les rubriques suivantes décrivent les concepts fondamentaux des pipelines. Pour obtenir un tutoriel décrivant l'implémentation de ces concepts, veuillez consulter Actions relatives aux pipelines.