AWS Glue

Guida per l'utente

Che cos'è AWS Glue?
Come funziona
Nozioni di base
Scoperta e catalogazione dei dati
Connessione ai dati
Creazione AWS Glue di posti di lavoro con sessioni interattive
Creazione di lavori ETL visivi con AWS Glue Studio
Utilizzo dei processi
AWS Glue Streaming
Integrazioni Zero-ETL
AWS Glue Qualità dei dati
Integrazione dei dati di Amazon Q in AWS Glue
Orchestrazione
AWS CloudFormation per AWS Glue
AWS Glue guida alla programmazione
Lavorare con AWS SDKs
AWS Glue API
AWS Glue Esempi di codice API
- Nozioni di base
  Ciao AWS Glue
  Informazioni di base
  Operazioni
  CreateCrawler
  CreateJob
  DeleteCrawler
  DeleteDatabase
  DeleteJob
  DeleteTable
  GetCrawler
  GetDatabase
  GetDatabases
  GetJob
  GetJobRun
  GetJobRuns
  GetTables
  ListJobs
  StartCrawler
  StartJobRun
Sicurezza
Risoluzione dei problemi AWS Glue
Migliorare AWS Glue le prestazioni
Problemi noti
Cronologia della documentazione
AWS Glossario

AWS Glue

Documentazione
AWS Glue
Guida per l'utente

AWS Glue Spark e lavori PySpark

PDF

RSS

Modalità Focus

AWS Glue Spark e lavori PySpark - AWS Glue

Documentazione AWS Glue Guida per l'utente

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

AWS Glue supporta Spark e jobs. PySpark Un job Spark viene eseguito in un ambiente Apache Spark gestito da. AWS Glue Elabora i dati in batch. Un processo ETL di streaming è simile a un processo Spark, ad eccezione del fatto che esegue ETL sui flussi di dati. Esso utilizza il framework Apache Spark Structured Streaming. Alcune caratteristiche dei processi Spark non sono disponibili per i processi ETL in streaming.

Le seguenti sezioni forniscono informazioni su AWS Glue Spark e sui job. PySpark

Argomenti

Configurazione delle proprietà dei job per i job Spark in AWS Glue
Modifica degli script Spark in AWS Glue console
Processi (legacy)
Monitoraggio dei dati elaborati mediante segnalibri di processo
Memorizzazione dei dati Spark shuffle
Monitoraggio AWS Glue Offerte di lavoro Spark
Risoluzione dei problemi di intelligenza artificiale generativa per Apache Spark in Glue AWS

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Parametri del processo

Configurazione delle proprietà dei job Spark

Questa pagina ti è stata utile? - Sì

Grazie per averci comunicato che stiamo facendo un buon lavoro!

Se hai un momento, ti invitiamo a dirci che cosa abbiamo fatto che ti è piaciuto così possiamo offrirti altri contenuti simili.

Questa pagina ti è stata utile? - No

Grazie per averci comunicato che questa pagina ha bisogno di essere modificata. Siamo spiacenti di non aver soddisfatto le tue esigenze.

Se hai un momento, ti invitiamo a dirci come possiamo migliorare la documentazione.

Argomento successivo:

Configurazione delle proprietà dei job Spark

Argomento precedente:

Parametri del processo

Hai bisogno di aiuto?

Prova AWS re:Post
Entra in contatto con un esperto AWS IQ

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie