Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
AWS Glue supporta Spark e jobs. PySpark Un processo Spark viene eseguito in un ambiente Apache Spark gestito da. AWS Glue Elabora i dati in batch. Un ETL job di streaming è simile a un job Spark, tranne per il fatto che viene eseguito ETL su flussi di dati. Esso utilizza il framework Apache Spark Structured Streaming. Alcune caratteristiche dei processi Spark non sono disponibili per i ETL processi di streaming di.
Nelle sezioni seguenti vengono fornite informazioni su AWS Glue Spark e sui PySpark processi Spark in.
Argomenti
- Configurazione delle proprietà dei job per i job Spark in AWS Glue
- Modifica degli script Spark nella pagina AWS Glue console
- Processi (legacy)
- Monitoraggio dei dati elaborati mediante segnalibri di processo
- Memorizzazione dei dati Spark shuffle
- Monitoraggio dei processi Spark AWS Glue
- Risoluzione dei problemi di intelligenza artificiale generativa per Apache Spark in Glue AWS