Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Utilizzo dei processi in AWS Glue

Modalità Focus
Utilizzo dei processi in AWS Glue - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Un AWS Glue job incapsula uno script che si connette ai dati di origine, li elabora e quindi li scrive nella destinazione dei dati. In genere, un job esegue script di estrazione, trasformazione e caricamento (ETL). I processi possono anche eseguire script Python generici (processi shell Python). AWS Glue I trigger possono avviare processi in base a una pianificazione, un evento o su richiesta. È possibile monitorare le esecuzioni dei processi per comprendere i parametri di runtime come esito positivo, durata e ora di inizio.

È possibile utilizzare script che AWS Glue generano oppure fornire script personalizzati. Con uno schema di origine e una posizione o uno schema di destinazione, il generatore di AWS Glue codice può creare automaticamente uno script Apache Spark API ()PySpark. Puoi usare questo script come punto di partenza e modificarlo per soddisfare gli obiettivi.

AWS Glue può scrivere file di output in diversi formati di dati, tra cui JSONCSV, ORC (Optimized Row Columnar), Apache Parquet e Apache Avro. Per alcuni formati di dati, possono essere scritti formati comuni di compressione.

AWS Glue supporta i seguenti tipi di lavori:

  • Un job Spark viene eseguito in un ambiente Apache Spark gestito da. AWS Glue Elabora i dati in batch.

  • Un ETL job di streaming è simile a un job Spark, tranne per il fatto che viene eseguito ETL su flussi di dati. Esso utilizza il framework Apache Spark Structured Streaming. Alcune funzionalità di Spark Job non sono disponibili per i lavori di streaming. ETL

  • Un processo di shell Python esegue gli script Python come shell e supporta una versione di Python che dipende dalla versione in uso. AWS Glue Puoi utilizzare questi processi per pianificare ed eseguire attività che non richiedono un ambiente Apache Spark.

  • Ray è un framework di calcolo distribuito open source che puoi utilizzare per aumentare i carichi di lavoro, con particolare attenzione a Python. AWS Glue I lavori Ray e le sessioni interattive ti consentono di utilizzare Ray all'interno. AWS Glue

Le seguenti sezioni forniscono informazioni su Ray Jobs ETL e in AWS Glue.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.