Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Utilizzo del framework Delta Lake in AWS Glue Studio

Modalità Focus
Utilizzo del framework Delta Lake in AWS Glue Studio - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo del framework Delta Lake in origini dati

Utilizzo del framework Delta Lake in origini dati Amazon S3

  1. Dal menu Origine, scegli Amazon S3.

  2. Se scegli la tabella del catalogo dati come tipo di origine di Amazon S3, scegli un database e una tabella.

  3. AWS Glue Studio mostra il formato come Delta Lake e l'URL di Amazon S3.

  4. Scegli Opzioni aggiuntive per inserire una coppia chiave-valore. Ad esempio, una coppia chiave-valore potrebbe essere: chiave: timestampAsOf e valore: 2023-02-24 14:16:18.

    Lo screenshot mostra la sezione Opzioni aggiuntive nella scheda Proprietà origine dati per un nodo di origine dati Amazon S3.
  5. Se scegli la posizione Amazon S3 come tipo di origine Amazon S3, scegli l'URL di Amazon S3 facendo clic su Sfoglia Amazon S3.

  6. In Formato data, scegli Delta Lake.

    Nota

    Se AWS Glue Studio non riesce a inferire lo schema dalla cartella o dal file Amazon S3 che hai selezionato, scegli Opzioni aggiuntive per selezionare una nuova cartella o un nuovo file.

    In Opzioni aggiuntive, scegli tra le seguenti opzioni in Inferenza dello schema:

    • Lascia che AWS Glue Studio scelga automaticamente un file di esempio: AWS Glue Studio sceglierà un file di esempio nella posizione di Amazon S3 in modo da poter inferire lo schema. Nel campo File con campionatura automatica, puoi visualizzare il file che è stato selezionato automaticamente.

    • Scegli un file di esempio da Amazon S3: scegli il file Amazon S3 da utilizzare facendo clic su Sfoglia Amazon S3.

  7. Fai clic su Inferisci schema. A questo punto potrai visualizzare lo schema di output facendo clic sulla scheda Schema di output.

Utilizzo del framework Delta Lake in origini dati Catalogo dati

  1. Dal menu Origine, scegli Catalogo dati AWS Glue Studio.

  2. Nella scheda Proprietà dell'origine dati, scegli un database e una tabella.

  3. AWS Glue Studio mostra il tipo di formato come Delta Lake e l'URL di Amazon S3.

    Nota

    Se la tua origine Delta Lake non è ancora registrata come tabella del catalogo dati AWS Glue, hai due opzioni:

    1. Creare un crawler AWS Glue per l'archivio dati Delta Lake. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake.

    2. Utilizzare un'origine dati Amazon S3 per selezionare la tua origine dati Delta Lake. Per informazioni, consultare Utilizzo del framework Delta Lake in origini dati Amazon S3 .

Utilizzo dei formati Delta Lake negli obiettivi dei dati

Utilizzo dei formati Delta Lake negli obiettivi dei dati del Catalogo dati

  1. Dal menu Destinazione, scegli Catalogo dati AWS Glue Studio.

  2. Nella scheda Proprietà dell'origine dati, scegli un database e una tabella.

  3. AWS Glue Studio mostra il tipo di formato come Delta Lake e l'URL di Amazon S3.

Utilizzo dei formati Delta Lake nelle origini dati di Amazon S3

Inserisci valori o scegli tra le opzioni disponibili per configurare il formato di Delta Lake.

  • Tipo di compressione: scegli una delle opzioni per il tipo di compressione: Uncompressed o Snappy.

  • Posizione di destinazione di Amazon S3: scegli la posizione di destinazione di Amazon S3 facendo clic su Sfoglia S3.

  • Opzioni di aggiornamento del Catalogo dati: l'aggiornamento del Catalogo dati non è supportato per questo formato nell'editor visivo di Glue Studio.

    • Do not update the Data Catalog (Non aggiornare il catalogo dati): (impostazione predefinita) scegli questa opzione se non vuoi che il processo aggiorni il catalogo dati, anche se lo schema viene modificato o sono aggiunte nuove partizioni.

    • Per aggiornare il Catalogo dati dopo l'esecuzione del processo AWS Glue, esegui o pianifica un crawler AWS Glue. Per ulteriori informazioni, consulta Come specificare le opzioni di configurazione per un archivio dati Delta Lake.

  • Chiavi di partizione: scegli quali colonne utilizzare come chiavi di partizionamento nell'output. Per aggiungere altre chiavi di partizione, scegli Add a partition key (Aggiungi una chiave di partizione).

  • Facoltativamente, scegli Opzioni aggiuntive per inserire una coppia chiave-valore. Ad esempio, una coppia chiave-valore potrebbe essere: chiave: timestampAsOf e valore: 2023-02-24 14:16:18.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.