Modifica le fasi del flusso di dati - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modifica le fasi del flusso di dati

In Amazon SageMaker Canvas, puoi modificare singoli passaggi dei flussi di dati per trasformare il set di dati senza dover creare un nuovo flusso di dati. La pagina seguente illustra come modificare le fasi di unione e concatenazione, nonché le fasi relative all'origine dei dati.

Modifica le fasi di unione e concatenazione

All'interno dei flussi di dati, hai la flessibilità di modificare le fasi di unione e concatenazione. È possibile apportare le modifiche necessarie al flusso di lavoro di elaborazione dei dati, assicurando che i dati vengano combinati e trasformati correttamente senza dover ripetere l'intero flusso di dati.

Per modificare una fase di unione o concatenazione del flusso di dati, procedi come segue:

  1. Apri il flusso di dati.

  2. Scegli l'icona più (+) accanto al nodo di unione o concatenazione che desideri modificare.

  3. Nel menu contestuale, selezionare Edit (Modifica).

  4. Si apre un pannello laterale in cui puoi modificare i dettagli dell'unione o della concatenazione. Modifica i campi dei passaggi, ad esempio il tipo di iscrizione. Per sostituire un nodo di dati e selezionarne uno diverso da unire o concatenare, scegli l'icona di eliminazione accanto al nodo e quindi, nella vista del flusso di dati, seleziona il nuovo nodo che desideri includere nella trasformazione.

    Nota

    Quando sostituisci un nodo durante il processo di modifica, puoi selezionare solo i passaggi che si verificano prima dell'operazione di unione o concatenazione. È possibile scambiare il nodo sinistro o destro, ma è possibile scambiare solo un nodo alla volta. Inoltre, non è possibile selezionare un nodo sorgente come sostituto.

  5. Scegliete Anteprima per visualizzare il risultato dell'operazione di combinazione.

  6. Scegli Update (Aggiorna) per salvare le modifiche.

Il flusso di dati dovrebbe ora essere aggiornato.

Modifica o sostituisci un passaggio relativo all'origine dei dati

Potrebbe essere necessario apportare modifiche alla fonte di dati o al set di dati senza eliminare le trasformazioni e le fasi del flusso di dati applicate ai dati originali. In Data Wrangler, puoi modificare o sostituire la configurazione dell'origine dati mantenendo le fasi del flusso di dati. Quando si modifica una fonte di dati, è possibile modificare le impostazioni di importazione, come la dimensione o il metodo di campionamento e qualsiasi impostazione avanzata. Puoi anche aggiungere altri file con lo stesso schema oppure, per fonti di dati basate su query come Amazon Athena, puoi modificare la query. Quando sostituisci un'origine dati, hai la possibilità di selezionare un set di dati diverso o persino di importare completamente i dati da un'altra fonte di dati, purché lo schema dei nuovi dati corrisponda ai dati originali.

Per modificare la configurazione di un'origine dati, procedi come segue:

  1. Nell'applicazione Canvas, vai alla pagina Data Wrangler.

  2. Scegli il tuo flusso di dati per visualizzarlo.

  3. Nella scheda Flusso di dati che mostra le fasi del flusso di dati, trova il nodo Origine che desideri modificare.

  4. Scegli l'icona con i puntini di sospensione accanto al nodo Sorgente.

  5. Nel menu contestuale, selezionare Edit (Modifica).

  6. Per le fonti di dati Amazon S3 e il caricamento locale, hai la possibilità di selezionare o caricare più file con lo stesso schema dei dati originali. Per le fonti di dati basate su query come Amazon Athena, puoi rimuovere e selezionare diverse tabelle nel generatore di query visive oppure puoi modificare direttamente la query. SQL Al termine, selezionare Next (Successivo).

  7. Per le impostazioni di importazione, apporta le modifiche desiderate.

  8. Quando hai finito, scegli Salva modifiche.

La tua fonte di dati dovrebbe ora essere aggiornata.

Per sostituire un'origine dati, procedi come segue:

  1. Nell'applicazione Canvas, vai alla pagina Data Wrangler.

  2. Scegli il tuo flusso di dati per visualizzarlo.

  3. Nella scheda Flusso di dati che mostra le fasi del flusso di dati, trova il nodo Origine che desideri modificare.

  4. Scegli l'icona con i puntini di sospensione accanto al nodo Sorgente.

  5. Dal menu contestuale, scegliete Sostituisci.

  6. Passa all'esperienza di creazione di un flusso di dati per selezionare un'altra fonte di dati e altri dati.

  7. Quando hai selezionato i dati e sei pronto per aggiornare il nodo sorgente, scegli Salva.

Ora dovresti vedere il nodo Sorgente aggiornato nel tuo flusso di dati.