Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Usa più fonti di dati con un crawler

Modalità Focus
Usa più fonti di dati con un crawler - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Quando un AWS Glue crawler esegue la scansione di Amazon S3 e rileva più directory, utilizza un'euristica per determinare dove si trova la radice di una tabella nella struttura di directory e quali directory sono partizioni per la tabella. Nei casi in cui gli schemi rilevati in due o più directory siano analoghi, il crawler potrebbe trattarli come partizioni invece di tabelle separate. Un metodo per aiutare il crawler a rilevare singole tabelle è aggiungere la directory radice di ciascuna tabella come datastore per il crawler.

Le seguenti partizioni in Amazon S3 sono un esempio:

s3://amzn-s3-demo-bucket/folder1/table1/partition1/file.txt s3://amzn-s3-demo-bucket/folder1/table1/partition2/file.txt s3://amzn-s3-demo-bucket/folder1/table1/partition3/file.txt s3://amzn-s3-demo-bucket/folder1/table2/partition4/file.txt s3://amzn-s3-demo-bucket/folder1/table2/partition5/file.txt

Se lo schema di table1 e table2 è simile e una singola origine dati è impostata su s3://amzn-s3-demo-bucket/folder1/ in AWS Glue, il crawler può creare una singola tabella con due colonne di partizione: una colonna di partizione che contiene table1 e table2 e una seconda colonna di partizione che contiene partition1 throughpartition5.

Per fare in modo che il AWS Glue crawler crei due tabelle separate, impostate il crawler in modo che abbia due origini dati e, s3://amzn-s3-demo-bucket/folder1/table1/ come illustrato nella procedura seguente. s3://amzn-s3-demo-bucket/folder1/table2

Per aggiungere un data store S3 a un crawler esistente in AWS Glue
  1. Accedi a AWS Management Console e apri la console all' AWS Glue indirizzo. https://console.aws.amazon.com/glue/

  2. Nel riquadro di navigazione, selezionare Crawlers (Crawler).

  3. Scegli il link al tuo crawler, quindi scegli Edit (Modifica).

  4. Per Fase 2: Scegli origini dei dati e classificatori, scegli Edit (Modifica).

  5. Per Origini dati e cataloghi, scegli Aggiungi un'origine dati.

  6. Nella finestra di dialogo Add data source (Aggiungi origine dei dati), per S3 path (Percorso S3), scegli Browse (Sfoglia).

  7. Scegli il bucket che vuoi utilizzare e poi seleziona Choose (Scegli).

    L'origine dei dati che hai aggiunto viene visualizzata nell'elenco Data sources (Origini dei dati).

  8. Scegli Next (Successivo).

  9. Nella pagina Configure security settings (Configura impostazioni di sicurezza), crea o scegli un ruolo IAM per il crawler, quindi scegli Next (Avanti).

  10. Assicurati che il percorso S3 termini con una barra finale, quindi scegli Add an S3 data source (Aggiungi un'origine dei dati S3).

  11. Nella pagina Set output and scheduling (Imposta l'output e la pianificazione), per Output configuration (Configurazione dell'output), scegli il database di destinazione.

  12. Scegli Next (Successivo).

  13. Nella pagina Review and update (Verifica e aggiorna), rivedi le scelte che hai fatto. Per modificare un passaggio, scegli Edit (Modifica).

  14. Scegli Aggiorna.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.