Struttura ed esecuzione della pipeline

Argomenti

Struttura della pipeline
Esecuzione della pipeline utilizzando la configurazione del parallelismo

Struttura della pipeline

Un'istanza Amazon SageMaker Pipelines è composta da un nameparameters, esteps. I nomi delle pipeline devono essere univoci all'interno di una coppia (account, region). Tutti i parametri utilizzati nelle definizioni delle fasi devono essere definiti nella pipeline. Le fasi della pipeline elencate determinano automaticamente il loro ordine di esecuzione in base alle reciproche dipendenze dei dati. Il servizio Pipelines risolve le relazioni tra le fasi della dipendenza dei dati DAG per creare una serie di passaggi che l'esecuzione completa. Il seguente è un esempio di struttura di pipeline.


from sagemaker.workflow.pipeline import Pipeline
  
  pipeline_name = f"AbalonePipeline"
  pipeline = Pipeline(
      name=pipeline_name,
      parameters=[
          processing_instance_type, 
          processing_instance_count,
          training_instance_type,
          model_approval_status,
          input_data,
          batch_data,
      ],
      steps=[step_process, step_train, step_eval, step_cond],
  )

Esecuzione della pipeline utilizzando la configurazione del parallelismo

Per impostazione predefinita, una pipeline esegue tutte le fasi disponibili per l'esecuzione in parallelo. È possibile controllare questo comportamento utilizzando la proprietà ParallelismConfiguration durante la creazione o l'aggiornamento di una pipeline, nonché quando si avvia o si ritenta l'esecuzione di una pipeline.

Le configurazioni di parallelismo vengono applicate per ogni esecuzione. Ad esempio, se vengono avviate due esecuzioni, ciascuna può eseguire un massimo di 50 passaggi contemporaneamente, per un totale di 100 fasi in esecuzione simultanea. Inoltre, qualsiasi ParallelismConfiguration all'avvio, al nuovo tentativo o all'aggiornamento di un'esecuzione ha la precedenza sulle configurazioni di parallelismo definite nella pipeline.

Esempio Creazione di un'esecuzione di pipeline con `ParallelismConfiguration`


pipeline = Pipeline(
        name="myPipeline",
        steps=[step_process, step_train]
    )

  pipeline.create(role, parallelism_config={"MaxParallelExecutionSteps": 50})

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Panoramica delle condutture

Gestione degli accessi

Struttura ed esecuzione della pipeline

Argomenti

Struttura della pipeline

Esecuzione della pipeline utilizzando la configurazione del parallelismo

Esempio Creazione di un'esecuzione di pipeline con ParallelismConfiguration

Esempio Creazione di un'esecuzione di pipeline con `ParallelismConfiguration`