Utilisation de formats de table autres que Hive dans Amazon Athena pour Apache Spark - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de formats de table autres que Hive dans Amazon Athena pour Apache Spark

Lorsque vous travaillez avec des sessions et des blocs-notes dans Athena pour Spark, vous pouvez utiliser les tables Linux Foundation Delta Lake, Apache Hudi et Apache Iceberg, en plus des tables Apache Hive.

Considérations et restrictions

Lorsque vous utilisez des formats de table autres qu'Apache Hive avec Athena pour Spark, tenez compte des points suivants :

  • Outre Apache Hive, un seul format de table est pris en charge par bloc-notes. Pour utiliser plusieurs formats de table dans Athena pour Spark, créez un bloc-notes distinct pour chaque format de table. Pour plus d'informations sur la création de blocs-notes dans Athena pour Spark, consultez Création de votre propre bloc-notes.

  • Les formats de table Delta Lake, Hudi et Iceberg ont été testés sur Athena pour Spark en les utilisant AWS Glue comme métastore. Vous pouvez peut-être utiliser d'autres métastores, mais cette utilisation n'est actuellement pas prise en charge.

  • Pour utiliser les formats de table supplémentaires, remplacez la propriété spark_catalog par défaut, comme indiqué dans la console Athena et dans cette documentation. Ces catalogues autres que Hive peuvent lire les tables Hive, en plus de leurs propres formats de table.

Versions de table

Le tableau suivant reprend les versions de table autres que Hive prises en charge dans Amazon Athena pour Apache Spark.

Format de table Version prise en charge
Apache Iceberg 1.2.1
Apache Hudi 0,13
Linux Foundation Delta Lake 2.0.2

Dans Athena pour Spark, ces fichiers .jar de format de table et leurs dépendances sont chargés dans le chemin de classe des pilotes et exécuteurs Spark.

Pour consulter un article de blog sur le AWS Big Data expliquant comment utiliser les formats de table Iceberg, Hudi et Delta Lake à l'aide de Spark SQL dans les blocs-notes Amazon Athena, consultez Utiliser Amazon Athena avec SQL Spark pour vos formats de tables transactionnels open source.