Creazione di un processo ETL utilizzando i notebook in AWS Glue Studio - AWS Aderenza

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Creazione di un processo ETL utilizzando i notebook in AWS Glue Studio

Per iniziare a utilizzare i notebook nella console AWS Glue Studio
  1. Allega le policy AWS Identity and Access Management all'utente AWS Glue Studio e crea un ruolo IAM per il processo e il notebook ETL.

  2. Configura la sicurezza IAM aggiuntiva per notebook, come descritto in Concessione delle autorizzazioni per il ruolo IAM.

  3. Accedi alla console AWS Glue Studio all'indirizzo https://console.aws.amazon.com/gluestudio/.

    Nota

    Verifica che il tuo browser non blocchi i cookie di terzi. Qualsiasi browser che blocca i cookie di terze parti per impostazione predefinita o abilitata dall'utente impedirà l'avvio di notebook. Per ulteriori informazioni sulla gestione dei cookie, consulta:

  4. Scegli il link Jobs (Processi) nel menu di navigazione a sinistra.

  5. Scegli Notebook Jupyter e quindi Create (Crea) per avviare una nuova sessione del notebook.

  6. Nella pagina Create job in Jupyter notebook (Crea processo nel notebook Jupyter), specifica il nome del processo, il ruolo IAM da utilizzare. Scegli Create job (Crea processo).

    Dopo un breve periodo di tempo, viene visualizzato l'editor del notebook.

  7. Dopo aver aggiunto il codice, è necessario eseguire la cella per avviare una sessione. Esistono diversi modi per eseguire la cella:

    • Premi il pulsante play.

    • Utilizza la scelta rapida da tastiera:

      • Su MacOS, Command + Invio per eseguire la cella.

      • Su Windows, Maius + Invio per eseguire la cella.

    Per informazioni sulla scrittura di codice utilizzando un'interfaccia per notebook Jupyter, vedi la Documentazione utente di Jupyter Notebook .

  8. Per testare lo script, esegui l'intero script o le singole celle. Qualsiasi output di comando verrà visualizzato nell'area sotto la cella.

  9. Dopo aver completato lo sviluppo del notebook, è possibile salvare il processo e quindi eseguirlo. Lo script è disponibile nella tabella Script. Tutte i magic aggiunti al taccuino verranno rimossi e non verranno salvati come parte dello script del processo AWS Glue. AWS Glue Studio aggiungerà automaticamente un job.commit() fino alla fine dello script generato dal contenuto di notebook.

    Per informazioni su come creare i processi, consulta Avviare un'esecuzione del processo.