Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creazione di ETL lavori visivi con AWS Glue Studio
Un record AWS Glue job incapsula uno script che si connette ai dati di origine, li elabora e quindi li scrive nella destinazione dei dati. In genere, un processo esegue gli script di estrazione, trasformazione e caricamento (ETL). I processi possono eseguire script progettati per ambienti di runtime Apache Spark e Ray. I job possono anche eseguire script Python generici (lavori in Python shell). AWS Glue i trigger possono avviare lavori in base a una pianificazione o a un evento o su richiesta. È possibile monitorare le esecuzioni dei processi per comprendere i parametri di runtime come esito positivo, durata e ora di inizio.
È possibile utilizzare script che AWS Glue genera o è possibile fornire il proprio. Con uno schema di origine e una posizione o uno schema di destinazione, il AWS Glue Studio il generatore di codice può creare automaticamente uno script Apache Spark API (PySpark). Puoi usare questo script come punto di partenza e modificarlo per soddisfare gli obiettivi.
AWS Glue può scrivere file di output in diversi formati di dati. Ogni tipo di processo può supportare diversi formati di output. Per alcuni formati di dati, possono essere scritti formati comuni di compressione.
Accesso a AWS Glue console
Un job in AWS Glue è costituito dalla logica aziendale che esegue le operazioni di estrazione, trasformazione e caricamento (ETL). È possibile creare lavori nella ETLsezione del AWS Glue consolle.
Per visualizzare i processi esistenti, accedi alla AWS Management Console e apri AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/
Durante la creazione di un nuovo processo o dopo averlo salvato, è possibile utilizzare AWS Glue Studio per modificare i tuoi ETL lavori. Poi farlo modificando i nodi nell'editor visivo o modificando lo script del processo in modalità sviluppatore. È inoltre possibile aggiungere e rimuovere nodi nell'editor visivo per creare ETL processi più complicati.
Passaggi successivi per la creazione di un processo in AWS Glue Studio
Puoi utilizzare l'editor visivo dei processi per configurare i nodi per il processo. Ogni nodo rappresenta un'azione, ad esempio la lettura di dati dalla posizione di origine o l'applicazione di una trasformazione ai dati. Ogni nodo aggiunto al processo dispone di proprietà che forniscono informazioni sulla posizione dei dati o sulla trasformazione.
I passaggi successivi per la creazione e la gestione dei lavori sono: