Estructura y ejecución de la canalización

Temas

Estructura de la canalización
Ejecución de canalización mediante la configuración del paralelismo

Estructura de la canalización

Una instancia de Amazon SageMaker Pipelines se compone de nameparameters, ysteps. Los nombres de las canalizaciones deben ser únicos en un par (account, region). Todos los parámetros utilizados en las definiciones de los pasos se deben definir en la canalización. Los pasos de la canalización enumerados determinan automáticamente su orden de ejecución en función de la dependencia de los datos entre sí. El servicio Pipelines resuelve las relaciones entre los pasos de la dependencia de datos DAG para crear una serie de pasos que se completan con la ejecución. A continuación se muestra un ejemplo de una estructura de canalización.


from sagemaker.workflow.pipeline import Pipeline
  
  pipeline_name = f"AbalonePipeline"
  pipeline = Pipeline(
      name=pipeline_name,
      parameters=[
          processing_instance_type, 
          processing_instance_count,
          training_instance_type,
          model_approval_status,
          input_data,
          batch_data,
      ],
      steps=[step_process, step_train, step_eval, step_cond],
  )

Ejecución de canalización mediante la configuración del paralelismo

De forma predeterminada, una canalización realiza todos los pasos que están disponibles para ejecutarse en paralelo. Puede controlar este comportamiento mediante la propiedad ParallelismConfiguration al crear o actualizar una canalización, así como al iniciar o reintentar la ejecución de una canalización.

Las configuraciones de paralelismo se aplican por ejecución. Por ejemplo, si se inician dos ejecuciones, cada una de ellas puede ejecutar un máximo de 50 pasos simultáneamente, lo que supone un total de 100 pasos ejecutados simultáneamente. Además, la ParallelismConfiguration especificada al iniciar, reintentar o actualizar una ejecución tiene prioridad sobre la configuración de paralelismo definida en la canalización.

ejemplo Creación de una ejecución en canalización con `ParallelismConfiguration`


pipeline = Pipeline(
        name="myPipeline",
        steps=[step_process, step_train]
    )

  pipeline.create(role, parallelism_config={"MaxParallelExecutionSteps": 50})

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Descripción general de las canalizaciones

Administración de accesos

Estructura y ejecución de la canalización

Temas

Estructura de la canalización

Ejecución de canalización mediante la configuración del paralelismo

ejemplo Creación de una ejecución en canalización con ParallelismConfiguration

ejemplo Creación de una ejecución en canalización con `ParallelismConfiguration`