Interroga i dati di S3 Express One Zone - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Interroga i dati di S3 Express One Zone

La classe di archiviazione Amazon S3 Express One Zone è una classe di archiviazione di Amazon S3 ad alte prestazioni che fornisce tempi di risposta nell'ordine dei millisecondi. Pertanto, è utile per le applicazioni che accedono frequentemente ai dati con centinaia di migliaia di richieste al secondo.

S3 Express One Zone replica e archivia i dati all'interno della stessa zona di disponibilità per ottimizzare velocità e costi. Ciò differisce dalle classi di storage regionali di Amazon S3, che replicano automaticamente i dati su almeno AWS tre zone di disponibilità all'interno di una. Regione AWS

Per ulteriori informazioni, consulta la pagina What is S3 Express One Zone? nella Guida per l'utente di Amazon S3.

Prerequisiti

Prima di iniziare, verifica che siano soddisfatte le seguenti condizioni:

  • Motore Athena versione 3: per utilizzare S3 Express One Zone con AthenaSQL, il gruppo di lavoro deve essere configurato per utilizzare il motore Athena versione 3.

  • Autorizzazioni S3 Express One Zone: quando S3 Express One Zone richiama un'operazione come GET, LIST o PUT su un oggetto Amazon S3, la classe di archiviazione chiama CreateSession per tuo conto. Per questo motivo, la IAM policy deve consentire l's3express:CreateSessionazione, che consente ad Athena di richiamare l'operazione corrispondente. API

Considerazioni e limitazioni

Durante l'interrogazione di S3 Express One Zone con Athena, considera i seguenti punti.

  • I bucket S3 Express One Zone supportano soltanto la crittografia SSE_S3. I risultati delle query Athena vengono scritti utilizzando la crittografia SSE_S3 indipendentemente dall'opzione di crittografia dei risultati delle query selezionata nelle impostazioni del gruppo di lavoro. Questa limitazione include tutti gli scenari in cui Athena scrive dati su bucket S3 Express One Zone, inclusi CREATE TABLE AS () CTAS e istruzioni. INSERT INTO

  • Il AWS Glue crawler non è supportato per la creazione di tabelle sui dati di S3 Express One Zone.

  • L'istruzione MSCK REPAIR TABLE non è supportata. Come soluzione alternativa, utilizza ALTER TABLE ADD PARTITION.

  • Nessuna istruzione di modifica delle tabelle per DDL Apache Iceberg (ovvero nessuna istruzione) è supportata per ALTER TABLE S3 Express One Zone.

  • I seguenti formati di file e tabelle non sono supportati o hanno un supporto limitato. Se i formati non sono elencati, ma sono supportati per Athena (come Parquet eJSON)ORC, allora sono supportati anche per l'uso con lo storage S3 Express One Zone.

    Formato di file o tabella Limitazione
    Apache Avro Non supportato
    CloudTrail registri Non supportato
    Apache Hudi Non supportato
    Amazon Ion Non supportato
    Log di Logstash Non supportato
    registri di Apache WebServer Non supportato
    Delta Lake DDLnon supportato. Per informazioni sulla creazione di una tabella Delta Lake utilizzando uno schema fittizio, consulta la pagina Sincronizza i metadati di Delta Lake. Le query SELECT sulla tabella sono supportate.

Inizia a usare

L'interrogazione dei dati di S3 Express One Zone con Athena è semplice. Per iniziare, attieniti alla procedura seguente.

Per usare Athena SQL per interrogare i dati di S3 Express One Zone
  1. Trasferisci i tuoi dati all'archiviazione S3 Express One Zone. Per ulteriori informazioni, consulta la pagina Setting the storage class of an object nella Guida per l'utente di Amazon S3.

  2. Utilizza un'istruzione CREATE TABLE in Athena per catalogare i tuoi dati in AWS Glue Data Catalog. Per ulteriori informazioni sulla creazione delle tabelle in Athena, consulta la pagina Crea tabelle in Athena e l'istruzione CREATE TABLE.

  3. (Facoltativo) Configura la posizione dei risultati della query del tuo gruppo di lavoro Athena per utilizzare un bucket di directory Amazon S3. I bucket di directory Amazon S3 sono più performanti dei bucket generici e sono progettati per carichi di lavoro o applicazioni critiche per le prestazioni che richiedono una latenza costante nell'ordine dei millisecondi. Per ulteriori informazioni, consulta la pagina Directory buckets overview nella Guida per l'utente di Amazon S3.