Informazioni su tabelle, database e cataloghi di dati in Athena - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Informazioni su tabelle, database e cataloghi di dati in Athena

In Athena, i cataloghi, i database e le tabelle sono container per le definizioni dei metadati che definiscono uno schema per i dati di origine sottostanti.

Athena utilizza i seguenti termini per fare riferimento alle gerarchie di oggetti dati:

  • Origine dati: un gruppo di database

  • Database: un gruppo di tabelle

  • Tabella: dati organizzati come gruppo di righe o colonne

A volte si fa riferimento a questi oggetti anche con nomi alternativi ma equivalenti, come i seguenti:

  • Un'origine dati talvolta viene definita catalogo.

  • Talvolta un database viene definito schema.

Nota

Questa terminologia può variare nelle fonti di dati federate utilizzate con Athena. Per ulteriori informazioni, consulta Comprendi i qualificatori dei nomi delle tabelle federate.

La seguente query di esempio nella console Athena utilizza l'origine dati awsdatacatalog, il database default e la tabella some_table.

Gerarchia degli oggetti dati nell'editor di query Athena.

Per ogni set di dati, deve esistere una tabella in Athena. I metadati nella tabella indicano ad Athena dove si trovano i dati in Amazon S3 e specificano la struttura dei dati, ad esempio, i nomi delle colonne, i tipi di dati e il nome della tabella. I database sono un raggruppamento logico di tabelle e inoltre contengono solo i metadati e le informazioni sullo schema per un set di dati.

Per ogni set di dati su cui si desidera eseguire query, Athena deve avere una tabella sottostante che utilizzerà per ottenere e restituire i risultati delle query. Pertanto, prima di eseguire query sui dati, occorre registrare una tabella in Athena. La registrazione si verifica quando si creano tabelle automaticamente o manualmente.

È possibile creare una tabella automaticamente utilizzando un AWS Glue crawler. Per ulteriori informazioni sui crawler AWS Glue e sui crawler, consulta. Utilizzalo AWS Glue per connettere Athena ai tuoi dati in Amazon S3 Quando AWS Glue crea una tabella, la registra nel proprio catalogo dati. AWS Glue Athena utilizza il catalogo dati AWS Glue per archiviare e recuperare questi metadati, utilizzandoli quando esegui query per analizzare il set di dati sottostante.

Indipendentemente dal modo in cui le tabelle vengono create, il processo di creazione delle tabelle registra il set di dati in Athena. Questa registrazione avviene in AWS Glue Data Catalog e consente ad Athena di eseguire interrogazioni sui dati. Nell'editor di query Athena, a questo catalogo (o origine dati) si fa riferimento con l'etichetta AwsDataCatalog.

Dopo aver creato una tabella, è possibile utilizzare SQLSELECTle istruzioni per interrogarla, inclusa la ricerca di posizioni di file specifiche per i dati di origine. I risultati della query sono archiviati in Amazon S3 nella posizione dei risultati delle query specificata.

Il catalogo AWS Glue dati è accessibile tramite il tuo account Amazon Web Services. Altri AWS servizi possono condividere il catalogo AWS Glue dati, in modo che tu possa vedere i database e le tabelle creati in tutta l'organizzazione utilizzando Athena e viceversa.

  • Creare una tabella manualmente:

    • Utilizzare la console Athena per eseguire la procedura guidata Crea tabella.

    • Usa la console Athena per scrivere DDL istruzioni Hive nell'editor di query.

    • Usa Athena API o CLI per eseguire una stringa di SQL query con DDL istruzioni.

    • Usa l'Athena JDBC o ODBC l'autista.

Quando si creano tabelle e database manualmente, Athena utilizza istruzioni HiveQL data definition language (DDL) come CREATE TABLECREATE DATABASE, e DROP TABLE under the hood per creare tabelle e database in. AWS Glue Data Catalog

Per iniziare, puoi utilizzare un tutorial nella console Athena o consultare una step-by-step guida nella documentazione di Athena.

  • Per utilizzare il tutorial nella console Athena, scegli l'icona delle informazioni in alto a destra della console, quindi scegli la scheda Tutorial.

  • Per un step-by-step tutorial sulla creazione di una tabella e sulla scrittura di interrogazioni nell'editor di query Athena, consulta. Inizia a usare