SageMaker Descripción general de las canalizaciones - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker Descripción general de las canalizaciones

Una canalización de Amazon SageMaker Model Building Pipelines es una serie de pasos interconectados que se definen mediante las canalizaciones SDK. También puede crear su canalización sin SDK utilizar el esquema de definición JSON de canalización. Esta definición de canalización codifica una canalización mediante un gráfico acíclico dirigido (DAG) que se puede exportar como definición. JSON Esto DAG proporciona información sobre los requisitos y las relaciones entre cada paso de la canalización. La estructura de una canalización DAG viene determinada por las dependencias de datos entre los pasos. Estas dependencias de datos se crean cuando las propiedades de la salida de un paso se transfieren como entrada a otro paso. La siguiente imagen es un ejemplo de una canalizaciónDAG:

Un ejemplo de gráfico acíclico dirigido a una canalización (DAG).
El ejemplo DAG incluye los siguientes pasos:
  1. AbaloneProcess, una instancia del paso de procesamiento, ejecuta un script de preprocesamiento con los datos utilizados para el entrenamiento. Por ejemplo, el script podría rellenar los valores faltantes, normalizar los datos numéricos o dividir los datos en los conjuntos de datos de tren, validación y prueba.

  2. AbaloneTrain, una instancia del paso de entrenamiento, configura los hiperparámetros y entrena un modelo a partir de los datos de entrada preprocesados.

  3. AbaloneEval, otra instancia del paso de procesamiento, evalúa la precisión del modelo. En este paso se muestra un ejemplo de una dependencia de datos: en este paso se utiliza la salida del conjunto de datos de prueba del. AbaloneProcess

  4. AbaloneMSECondes una instancia de un paso de condición que, en este ejemplo, comprueba que el mean-square-error resultado de la evaluación del modelo esté por debajo de un límite determinado. Si el modelo no cumple los criterios, el recorrido de la tubería se detiene.

  5. El recorrido de la tubería continúa con los siguientes pasos:

    1. AbaloneRegisterModel, donde se SageMaker solicita un RegisterModelpaso para registrar el modelo como un grupo de paquetes de modelos versionados en el Registro de SageMaker modelos de Amazon.

    2. AbaloneCreateModel, donde se SageMaker indica un CreateModelpaso para crear el modelo como preparación para la transformación por lotes. EnAbaloneTransform, SageMaker invoca un paso de transformación para generar predicciones del modelo en un conjunto de datos que especifique.

En los siguientes temas se describen los conceptos fundamentales de SageMaker Pipelines. Para ver un tutorial que describe la implementación de estos conceptos, consulte Crear y gestionar SageMaker canalizaciones.