Interrogez les données de S3 Express One Zone - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Interrogez les données de S3 Express One Zone

La classe de stockage Amazon S3 Express One Zone est une classe de stockage Amazon S3 très performante qui fournit des temps de réponse de l’ordre de la milliseconde. En tant que tel, il est utile pour les applications qui accèdent fréquemment aux données avec des centaines de milliers de requêtes par seconde.

S3 Express One Zone réplique et stocke les données au sein de la même zone de disponibilité afin d’optimiser la vitesse et les coûts. Cela diffère des classes de stockage régionales Amazon S3, qui répliquent automatiquement les données sur au moins trois zones de AWS disponibilité au sein d'un Région AWS.

Pour plus d’informations, veuillez consulter What is S3 Express One Zone? dans le Guide de l’utilisateur Amazon S3.

Prérequis

Vérifiez que les conditions suivantes sont réunies avant de commencer :

  • Moteur Athena version 3 — Pour utiliser S3 Express One Zone avec AthenaSQL, votre groupe de travail doit être configuré pour utiliser le moteur Athena version 3.

  • Autorisations S3 Express One Zone : lorsque S3 Express One Zone appelle une action telle que GET, LIST ou PUT sur un objet Amazon S3, la classe de stockage appelle CreateSession en votre nom. Pour cette raison, votre IAM politique doit autoriser l's3express:CreateSessionaction, ce qui permet à Athéna d'invoquer l'opération correspondanteAPI.

Considérations et restrictions

Lorsque vous interrogez S3 Express One Zone avec Athena, tenez compte des points suivants.

  • Les compartiments S3 Express One Zone ne prennent en charge que le chiffrement SSE_S3. Les résultats des requêtes Athena sont écrits à l’aide du chiffrement SSE_S3, quelle que soit l’option que vous avez choisie dans les paramètres du groupe de travail pour chiffrer les résultats des requêtes. Cette limitation inclut tous les scénarios dans lesquels Athena écrit des données dans des compartiments S3 Express One Zone, y compris CREATE TABLE AS (CTAS) et des instructions. INSERT INTO

  • Le AWS Glue robot d'exploration n'est pas pris en charge pour créer des tables sur les données S3 Express One Zone.

  • L’instruction MSCK REPAIR TABLE n’est pas prise en charge. Comme solution de contournement, utilisez ALTER TABLE ADD PARTITION.

  • Aucune instruction de modification DDL de table pour Apache Iceberg (c'est-à-dire aucune instructionALTER TABLE) n'est prise en charge pour S3 Express One Zone.

  • Les formats de fichiers et de tables suivants ne sont pas pris en charge ou sont pris en charge de manière limitée. Si les formats ne sont pas répertoriés, mais qu'ils sont pris en charge par Athena (tels que Parquet etJSON), ils sont également pris en charge pour une utilisation avec le stockage S3 Express One Zone. ORC

    Format de fichier ou de table Limitation
    Apache Avro Non pris en charge
    CloudTrail journaux Non pris en charge
    Apache Hudi Non pris en charge
    Amazon Ion Non pris en charge
    Journaux Logstash Non pris en charge
    WebServer Journaux Apache Non pris en charge
    Delta Lake DDLnon pris en charge. Pour plus d’informations sur la création d’une table Delta Lake à l’aide d’un schéma factice, consultez Synchroniser les métadonnées de Delta Lake. Les requêtes SELECT sur la table sont prises en charge.

Mise en route

L’interrogation des données S3 Express One Zone avec Athena est simple. Pour démarrer, suivez la procédure ci-dessous.

Pour utiliser Athena SQL pour interroger les données de S3 Express One Zone
  1. Transférez vos données vers le stockage S3 Express One Zone. Pour de plus amples informations, consultez la rubrique Définition de la classe de stockage d’un objet dans le Guide de l’utilisateur Amazon S3.

  2. Utilisez une instruction CREATE TABLE dans Athena pour cataloguer vos données dans AWS Glue Data Catalog. Pour plus d’informations sur la création des tables dans Athena, consultez Création de tables dans Athena et l’instruction CREATE TABLE.

  3. (Facultatif) Configurez l’emplacement des résultats de requête de votre groupe de travail Athena pour utiliser un compartiment de répertoire Amazon S3. Les compartiments de répertoire Amazon S3 sont plus performants que les compartiments généraux et sont conçus pour les charges de travail ou les applications critiques en termes de performances qui nécessitent une latence constante de l’ordre de la milliseconde. Pour plus d’informations, consultez la rubrique Directory buckets overview dans le Guide de l’utilisateur Amazon S3.