Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Notes de mise à jour
Décrit les fonctions, les améliorations et les corrections de bogues d'Amazon Athena par date de publication.
Notes de publication d'Athena pour 2024
30 octobre 2024
Publié le 2024-10-30
Athena publie la version 3.3.0 JDBC du pilote. Pour plus d'informations sur cette version du pilote, consultezNotes de mise à jour d'Amazon Athena JDBC 3.x. Pour télécharger le pilote JDBC 3.x, consultezJDBCTéléchargement du pilote 3.x.
23 août 2024
Publié le 2024-09-05
Athéna annonce ce qui suit :
-
Interrogation de vues fédérées à l'aide de requêtes passthrough : les requêtes passthrough fédérées sont désormais prises en charge pour les vues. Pour de plus amples informations, veuillez consulter Interrogez les vues fédérées.
-
Requêtes intermédiaires multiples : vous pouvez désormais exécuter plusieurs requêtes intermédiaires fédérées au cours de la même exécution de requête. Pour de plus amples informations, veuillez consulter Utiliser des requêtes directes fédérées.
-
Correction de la table Iceberg — OPTIMIZE Correction d'un problème en raison duquel l'exécution
OPTIMIZE
sur une table Iceberg ne supprimait pas les fichiers « supprimés » lors de la réécriture de fichiers de données auxquels un fichier de suppression était associé était associé. Pour de plus amples informations, veuillez consulter OPTIMIZE. -
Support pour le parquet LZ4 et l'LZOécriture — Athena ne prend plus en charge l'écriture de fichiers Parquet compressés au format LZ4 orLZO. Les lectures pour ces formats de compression sont toujours prises en charge. Pour plus d'informations sur les formats de compression dans Athena, consultez. Utiliser la compression dans Athena
29 juillet 2024
Publié le 29/07/2024-07
Athena publie la version 3.2.2 JDBC du pilote. Pour plus d'informations sur cette version du pilote, consultezNotes de mise à jour d'Amazon Athena JDBC 3.x. Pour télécharger le pilote JDBC 3.x, consultezJDBCTéléchargement du pilote 3.x.
26 juillet 2024
Publié le 2024-08-01
Athena annonce l'amélioration suivante.
-
Support des vecteurs de suppression des tables de Delta Lake — Athena prend désormais en charge la lecture à partir des tables de Delta Lake avec des vecteurs de suppression
. Pour de plus amples informations, veuillez consulter Consultez les tables de Delta Lake de la Linux Foundation.
3 juillet 2024
Publié le 2024-07-03
Athena publie la version 3.2.1 JDBC du pilote. Pour plus d'informations sur cette version du pilote, consultezNotes de mise à jour d'Amazon Athena JDBC 3.x. Pour télécharger le pilote JDBC 3.x, consultezJDBCTéléchargement du pilote 3.x.
26 juin 2024
Publié le 2024-06-26
La capacité provisionnée est désormais généralement disponible dans les régions d'Amérique du Sud (São Paulo) et d'Europe (Espagne). La capacité provisionnée vous permet d'exécuter des SQL requêtes sur une capacité de calcul entièrement gérée et fournit des fonctionnalités de gestion des charges de travail qui vous aident à hiérarchiser, contrôler et dimensionner vos charges de travail interactives les plus importantes. Vous pouvez ajouter une capacité à tout moment pour augmenter le nombre de requêtes que vous pouvez exécuter simultanément, contrôler les charges de travail utilisant cette capacité et partager la capacité entre les charges de travail.
Pour de plus amples informations, veuillez consulter Gérer la capacité de traitement des requêtes. Pour obtenir des informations sur la tarification, consultez la page Tarification Amazon Athena
10 mai 2024
Publié le 15/07/2024-07
Athena annonce les fonctions et améliorations suivantes.
-
Delta Lake — Athena a ajouté des optimisations qui filtrent les entrées inutiles des fichiers de points de contrôle. Ces optimisations permettent d'améliorer considérablement les performances pour les requêtes comportant des fichiers de points de contrôle volumineux qui font référence à de nombreux fichiers de données Parquet.
Pour plus d'informations sur l'utilisation des tables Delta Lake de la Linux Foundation avec Athena, consultez. Consultez les tables de Delta Lake de la Linux Foundation
26 avril 2024
Publié le 2024-04-26
Athena publie la version 3.2.0 JDBC du pilote. Pour plus d'informations sur cette version du pilote, consultezNotes de mise à jour d'Amazon Athena JDBC 3.x. Pour télécharger le pilote JDBC 3.x, consultezJDBCTéléchargement du pilote 3.x.
24 avril 2024
Publié le 24-04-24
Athena annonce les correctifs et améliorations suivants.
-
Parquet — Athena prend désormais en charge les lectures rétrocompatibles dans Parquet pour les champs primitifs répétés et non annotés qui ne figurent pas dans une liste ou un groupe de cartes. Cette modification empêche le renvoi de résultats incorrects en silence et améliore les messages d'erreur en cas de non-concordance entre les schémas.
Pour plus d'informations, consultez la section Support des lectures rétrocompatibles pour les champs primitifs répétés non annotés dans Parquet sur .com
. GitHub -
Iceberg OPTIMIZE — Résolution d'un problème lié aux
OPTIMIZE
requêtes qui entraînait la perte de données lorsqu'un filtre autre qu'une clé de partition était utilisé dans uneWHERE
clause. Pour de plus amples informations, veuillez consulter OPTIMIZE.
16 avril 2024
Publié le 16/04/2024-04
Utilisez la nouvelle fonctionnalité de transmission de requêtes fédérée Amazon Athena pour exécuter des requêtes complètes directement sur la source de données sous-jacente. Les requêtes intermédiaires fédérées vous aident à tirer parti des fonctions uniques, du langage de requête et des capacités de performance de la source de données d'origine. Par exemple, vous pouvez exécuter des requêtes Athena sur DynamoDB à l'aide du langage partiQL. Les requêtes intermédiaires fédérées sont également utiles lorsque vous souhaitez exécuter des SELECT
requêtes qui regroupent, joignent ou invoquent des fonctions de votre source de données qui ne sont pas disponibles dans Athena. L'utilisation de requêtes directes permet de réduire la quantité de données traitées par Athena et d'accélérer les temps de requête.
Pour de plus amples informations, veuillez consulter Utiliser des requêtes directes fédérées. Pour mettre à niveau les connecteurs que vous utilisez aujourd'hui vers la dernière version, voirMettre à jour un connecteur de source de données.
10 avril 2024
Publié le 10/04/2024-04
Athena annonce les fonctions et améliorations suivantes.
ODBCPilote 1.2.3.1000
ODBCSortie du pilote 1.2.3.1000 pour Athena.
Problèmes résolus :
-
Problème de connexion au serveur proxy : lorsqu'un serveur proxy était utilisé sans le certificat racine, le connecteur ne parvenait pas à établir de connexion.
Pour plus d'informations et pour télécharger le pilote ODBC 1.x, les notes de version et la documentation, consultezpilote Athena 1.x ODBC.
JDBCpilote 2.1.5
JBDCVersion du pilote 2.1.5 pour Athena.
Mises à jour et améliorations :
-
Mise à jour de AWS Java SDK pour utiliser la version 1.12.687.
-
Bibliothèques Jackson mises à jour pour utiliser la version 2.16.0.
-
Bibliothèques Logback mises à jour pour utiliser la version 1.3.14.
Pour plus d'informations et pour télécharger le pilote JDBC 2.x, les notes de version et la documentation, consultezPilote JDBC 2.x d'Athena.
8 avril 2024
Publié le 2024-04-08
Athena annonce la version 2.0.3.0 ODBC du pilote. Pour plus d'informations, consultez les notes de mise à jour de 2.0.3.0. Pour télécharger le nouveau pilote ODBC v2, voirTéléchargement du pilote ODBC 2.x. Pour obtenir des informations de connexion, veuillez consulter Amazon Athena ODBC 2.x.
15 mars 2024
Publié le 2024-03-18
Amazon Athena annonce la disponibilité d'Athena SQL dans la région du Canada Ouest (Calgary).
Pour une liste complète des services Services AWS disponibles dans chacun d'entre eux Région AWS, voir AWS Services par région
15 février 2024
Publié le 15/02/2020
Athena publie la version 3.1.0 JDBC du pilote.
La version 3.1.0 JDBC du pilote Amazon Athena ajoute la prise en charge de l'authentification intégrée Windows Microsoft Active Directory Federation Services (AD FS) et de l'authentification par formulaire. La version 3.1.0 inclut également d'autres améliorations mineures et des corrections de bogues.
Pour télécharger le pilote JDBC v3, voirJDBCTéléchargement du pilote 3.x.
31 janvier 2024
Publié le 2024-01-31
Athena annonce les fonctions et améliorations suivantes.
-
Mise à niveau de Hudi — Vous pouvez désormais utiliser SQL Athena pour interroger les tables Hudi 0.14.0. Pour plus d'informations sur l'utilisation d'Athena SQL pour interroger les tables Hudi, consultez. Interrogez les ensembles de données Apache Hudi
Notes de mise à jour d'Athena pour 2023
14 décembre 2023
Date de publication : 14/12/2023
Athena annonce les correctifs et améliorations suivants.
Athena publie la version 2.1.3 JDBC du pilote. Le pilote résout les problèmes suivants :
-
La journalisation a été améliorée pour éviter les conflits avec la journalisation des applications Spring Boot et Gradle.
-
Lors de l'utilisation de la
executeBatch()
JDBC méthode d'insertion d'enregistrements, le pilote n'a inséré qu'un seul enregistrement de manière incorrecte. Athena ne prenant pas en charge l’exécution par lots de requêtes, le pilote signale désormais une erreur lorsque vous utilisezexecuteBatch()
. Pour contourner cette limitation, vous pouvez soumettre des requêtes uniques dans une boucle.
Pour télécharger le nouveau JDBC pilote, les notes de version et la documentation, consultezPilote JDBC 2.x d'Athena.
9 décembre 2023
Date de publication : 09/12/2023
A publié le pilote ODBC 1.2.1.1000 pour Athena.
Fonctionnalités et améliorations :
-
RStudioSupport mis à jour — Le ODBC pilote est désormais compatible avec RStudio macOS.
-
Prise en charge des catalogues et schémas uniques : le connecteur peut désormais renvoyer un catalogue et un schéma uniques. Pour plus d’informations, consultez le guide de configuration et d’installation téléchargeable.
Problèmes résolus :
-
Instructions préparées : lorsque des instructions préparées avec un tableau de paramètres à l’aide d’un schéma en colonnes étaient exécutées, le connecteur renvoyait un résultat de requête incorrect.
-
Taille de colonne : lorsque la colonne système
$file_modified_time
était sélectionnée, le connecteur renvoyait une taille de colonne incorrecte. -
SQLPrepare— Lors de la liaison de paramètres liés
SQLPrepare
àSELECT
des requêtes, le connecteur a renvoyé une erreur.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez pilote Athena 1.x ODBC.
7 décembre 2023
Date de publication : 07/12/2023
Athena annonce la version 2.0.2.1 ODBC du pilote. Pour plus d'informations, consultez les notes de mise à jour de 2.0.2.1. Pour télécharger le nouveau pilote ODBC v2, voirTéléchargement du pilote ODBC 2.x. Pour obtenir des informations de connexion, veuillez consulter Amazon Athena ODBC 2.x.
5 décembre 2023
Date de publication : 05/12/2023
Vous pouvez désormais créer des SQL groupes de travail Athena qui utilisent AWS IAM Identity Center le mode d'authentification. Ces groupes de travail prennent en charge la fonctionnalité de propagation d'identité fiable d'IAMIdentity Center. La propagation fiable des identités permet d'utiliser les identités dans des services AWS d'analyse tels qu'Amazon Athena et Amazon EMR Studio.
Pour de plus amples informations, veuillez consulter Utiliser les IAM groupes de travail Athena compatibles avec Identity Center.
28 novembre 2023
Date de publication : 28/11/2023
Vous pouvez désormais interroger les données dans la classe de stockage Amazon S3 Express One Zone
Pour de plus amples informations, veuillez consulter Interrogez les données de S3 Express One Zone.
27 novembre 2023
Date de publication : 27/11/2023
Athena annonce les fonctions et améliorations suivantes.
-
Vues du catalogue de données Glue : les vues du catalogue de données Glue fournissent une vue commune unique sur AWS des services tels qu'Amazon Athena et Amazon Redshift. Dans les affichages du Catalogue de données Glue, les autorisations d’accès sont définies par l’utilisateur qui a créé l’affichage, et non par l’utilisateur qui interroge l’affichage. Ces affichages permettent de mieux contrôler l’accès, aident à garantir le caractère complet des enregistrements, offrent une sécurité renforcée et peuvent empêcher l’accès aux tables sous-jacentes.
Pour de plus amples informations, veuillez consulter Utiliser les vues du catalogue de données dans Athena.
-
CloudTrail Assistance dans Lake : vous pouvez désormais utiliser Amazon Athena pour analyser les données dans AWS CloudTrail Lake. AWS CloudTrail Lake est un lac de données géré CloudTrail que vous pouvez utiliser pour agréger, stocker et analyser de manière immuable les journaux d'activité à des fins d'audit, de sécurité et d'enquêtes opérationnelles. Pour interroger vos journaux d'activité CloudTrail du lac auprès d'Athena, vous n'avez pas besoin de déplacer des données ou de créer des pipelines de traitement de données distincts. Aucune ETL opération n'est requise.
Pour commencer, activez la fédération des données dans CloudTrail Lake. Lorsque vous partagez les métadonnées de votre magasin de données d'événements CloudTrail Lake avec AWS Glue Data Catalog, que vous CloudTrail créez les AWS Glue Data Catalog ressources nécessaires et que vous enregistrez les données auprès de AWS Lake Formation. Dans Lake Formation, vous pouvez spécifier les utilisateurs et les rôles qui peuvent utiliser Athena pour interroger votre entrepôt de données d’événements.
Pour plus d’informations, consultez la rubrique Enable Lake query federation dans le Guide de l’utilisateur AWS CloudTrail .
17 novembre 2023
Date de publication : 17/11/2023
Athena annonce les fonctions et améliorations suivantes.
Fonctionnalités
-
Optimiseur basé sur les coûts — Athena annonce la disponibilité générale de l'optimisation basée sur les coûts à l'aide des statistiques de. AWS Glue Pour optimiser vos requêtes dans AthenaSQL, vous pouvez demander à Athéna de recueillir des statistiques au niveau des tables ou des colonnes pour vos tables dans. AWS Glue Si toutes les tables de votre requête contiennent des statistiques, Athena utilise ces statistiques pour examiner d'autres plans d'exécution et sélectionner celui ayant le plus de chances d'être le plus rapide.
Pour de plus amples informations, veuillez consulter Utilisez l'optimiseur basé sur les coûts.
-
Intégration à Amazon EMR Studio — Vous pouvez désormais utiliser Athena dans un Amazon EMR Studio sans avoir à utiliser directement la console Athena. Grâce à l'intégration Athena dans AmazonEMR, vous pouvez effectuer les tâches suivantes :
-
Exécuter des requêtes Athena SQL
-
Afficher les résultats des requêtes
-
Afficher l'historique des requêtes
-
Afficher les requêtes enregistrées
-
Exécuter des requêtes paramétrées
-
Afficher les bases de données, les tables et les vues d'un catalogue de données
Pour plus d'informations, consultez Amazon EMR Studio dans la Service AWS intégrations avec Athena rubrique.
-
-
Contrôle d'accès imbriqué : Athena annonce la prise en charge du contrôle d'accès aux données imbriquées dans Lake Formation. Dans Lake Formation, vous pouvez définir et appliquer des filtres de données sur des colonnes imbriquées contenant des types de données
struct
. Vous pouvez utiliser le filtrage des données pour restreindre l'accès des utilisateurs aux sous-structures des colonnes imbriquées. Pour plus d'informations sur la création de filtres de données pour les données imbriquées, veuillez consulter Créer un filtre de données dans le Guide du développeur AWS Lake Formation (langue française non garantie). -
Mesures d'utilisation de la capacité allouée — Athena annonce de CloudWatch nouvelles mesures pour les réservations de capacité. Vous pouvez utiliser les nouvelles mesures pour suivre le nombre de données DPUs que vous avez provisionnées et le nombre de données DPUs utilisées par vos requêtes. Lorsque les requêtes sont terminées, vous pouvez également afficher le nombre de DPUs requêtes consommées.
Pour de plus amples informations, veuillez consulter Surveillez les métriques des requêtes Athena avec CloudWatch.
Améliorations
-
Modification du message d'erreur : le message d'erreur
Insufficient Lake Formation permissions
est désormais libelléTable not found
ouSchema not found
. Cette modification a été apportée pour empêcher les acteurs malveillants de déduire l'existence de ressources de table ou de base de données à partir du message d'erreur.
16 novembre 2023
Date de publication : 16/11/2023
Athena lance un nouveau JDBC pilote qui améliore l'expérience de connexion, d'interrogation et de visualisation des données provenant d'applications de SQL développement et de business intelligence compatibles. La mise à jour du nouveau pilote est simple. Le pilote peut lire les résultats des requêtes directement à partir d'Amazon S3, ce qui permet de les mettre à votre disposition plus rapidement.
Pour de plus amples informations, veuillez consulter pilote Athena 3.x JDBC.
31 octobre 2023
Date de publication : 31/10/2023
Amazon Athena annonce des réserves d'une heure pour la capacité allouée. À compter d'aujourd'hui, vous pouvez réserver et libérer de la capacité allouée au bout d'une heure. Cette modification simplifie l'optimisation des coûts pour les charges de travail dont la demande évolue au fil du temps.
La capacité allouée est une fonctionnalité d'Athena qui fournit des capacités de gestion des charges de travail vous permettant de hiérarchiser, de contrôler et de mettre à l'échelle vos charges de travail interactives les plus importantes. Vous pouvez ajouter une capacité à tout moment pour augmenter le nombre de requêtes que vous pouvez exécuter simultanément, contrôler les charges de travail utilisant cette capacité et partager la capacité entre les charges de travail.
Pour de plus amples informations, veuillez consulter Gérer la capacité de traitement des requêtes. Pour obtenir des informations sur la tarification, consultez la page de Tarification d'Amazon Athena
25 octobre 2023
Date de publication : 26/10/2023
Athena annonce les correctifs et améliorations suivants.
package jackson-core JSON — le texte dont la valeur numérique est supérieure à 1 000 caractères échouera désormais. Ce correctif résout le problème de sécurité sonatype-2022-6438
17 octobre 2023
Date de publication : 17/10/2023
Athena annonce la version 2.0.2.0 ODBC du pilote. Pour plus d'informations, consultez les notes de mise à jour de 2.0.2.0. Pour télécharger le nouveau pilote ODBC v2, voirTéléchargement du pilote ODBC 2.x. Pour obtenir des informations de connexion, veuillez consulter Amazon Athena ODBC 2.x.
26 septembre 2023
Date de publication : 26/09/2023
Athena annonce les fonctions et améliorations suivantes.
-
Support de lecture de Lake Formation pour les tables Delta Lake. Pour plus d'informations sur l'utilisation des tables Delta Lake avec Athena, veuillez consulter Consultez les tables de Delta Lake de la Linux Foundation.
23 août 2023
Date de publication : 23/08/2023
Amazon Athena annonce la disponibilité d'Athena SQL dans la région d'Israël (Tel Aviv).
Pour une liste complète des services Services AWS disponibles dans chacun d'entre eux Région AWS, voir AWS Services par région
10 août 2023
Date de publication : 10/08/2023
Athena annonce les correctifs et améliorations suivants.
ODBCversion du pilote 2.0.1.1
Athena annonce la version 2.0.1.1 ODBC du pilote. Pour plus d'informations, consultez les notes de mise à jour de 2.0.1.1. Pour télécharger le nouveau pilote ODBC v2, voirTéléchargement du pilote ODBC 2.x. Pour obtenir des informations de connexion, veuillez consulter Amazon Athena ODBC 2.x.
JDBCversion du pilote 2.1.1
Athena publie la version 2.1.1 JDBC du pilote. Le pilote résout les problèmes suivants :
-
Erreur survenue lors de la création d'une table avec une instruction contenant une expression régulière.
-
Problème causant une application incorrecte du paramètre de connexion
ApplicationName
.
Pour télécharger le nouveau JDBC pilote, les notes de version et la documentation, consultezConnectez-vous à Amazon Athena avec JDBC.
31 juillet 2023
Date de publication : 31/07/2023
Amazon Athena annonce la disponibilité d'SQLAthena en supplément. Régions AWS
Cette version étend la disponibilité d'Athena SQL pour inclure l'Asie-Pacifique (Hyderabad), l'Asie-Pacifique (Melbourne), l'Europe (Espagne) et l'Europe (Zurich).
Pour une liste complète des services Services AWS disponibles dans chacun d'entre eux Région AWS, voir AWS Services par région
27 juillet 2023
Date de publication : 27/07/2023
Athena lance la version 2023.30.1 BigQuery du connecteur Google. Cette version du connecteur réduit le temps d'exécution des requêtes et permet d'effectuer des requêtes sur des points de terminaison BigQuery privés.
Pour plus d'informations sur le BigQuery connecteur Google, consultezConnecteur Amazon Athena pour Google BigQuery . Pour de plus amples informations sur la mise à jour de vos connecteurs de source de données existants, consultez Mettre à jour un connecteur de source de données.
24 juillet 2023
Date de publication : 24/07/2023
Athena annonce les correctifs et améliorations suivants.
-
Requêtes comprenant des unions : amélioration des performances de certaines requêtes comprenant des unions.
-
Jointures comprenant des comparaisons de types : correction d'un échec de requête potentiel des instructions
JOIN
incluant une comparaison entre deux types différents. -
Sous-requêtes sur des colonnes imbriquées : correction d'un problème lié aux échecs de requêtes lorsque les sous-requêtes étaient corrélées sur des colonnes imbriquées.
-
Vues Iceberg : correction d'un problème de compatibilité lié à la précision des colonnes d'horodatage dans les vues Apache Iceberg. Les vues Iceberg comportant des colonnes d'horodatage sont désormais lisibles, que les colonnes aient été créées sur la version 2 ou 3 du moteur Athena.
20 juillet 2023
Date de publication : 20/07/2023
Athena publie la version 2.1.0 JDBC du pilote. Le pilote inclut de nouvelles améliorations et a résolu un problème.
Améliorations
Les bibliothèques d'JSONanalyseurs Jackson
-
jackson-annotations 2.15.2 (auparavant 2.14.0)
-
jackson-core 2.15.2 (auparavant 2.14.0)
-
jackson-databind 2.15.2 (auparavant 2.14.0)
Problèmes résolus
-
Correction d'un problème de transfert de paramètres de tableau lors de l'utilisation de la bibliothèque sql2o
.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
13 juillet 2023
Date de publication : 19/09/2023
Athena annonce les fonctions et améliorations suivantes.
-
EXPLAINANALYZE— Ajout de la prise en charge de la file d'attente, de l'analyse, de la planification et du temps d'exécution à la sortie de
EXPLAIN ANALYZE
. -
EXPLAIN—
EXPLAIN
la sortie affiche désormais des statistiques lorsque la requête contient des agrégations. -
Parquet Hive SerDe — Ajout de la
parquet.ignore.statistics
propriété permettant d'ignorer les statistiques de traitement lors de la lecture des données Parquet. Pour plus d’informations, veuillez consulter Ignorer les statistiques du parquet.
Pour plus d'informations sur EXPLAIN
et EXPLAIN ANALYZE
, consultez Utiliser EXPLAIN et EXPLAIN ANALYZE dans Athéna. Pour plus d'informations sur le Parquet Hive SerDe, consultezParquet SerDe.
3 juillet 2023
Date de publication : 25/07/2023
Depuis le 3 juillet 2023, Athéna a commencé à supprimer les chaînes de requête des journaux. CloudTrail La chaîne de requête a désormais une valeur de ***OMITTED***
. Cette modification a été apportée pour empêcher la divulgation involontaire de noms de tables ou de valeurs de filtres susceptibles d'inclure des informations sensibles. Si vous utilisiez auparavant les CloudTrail journaux pour accéder aux chaînes de requête complètes, nous vous recommandons d'utiliser Athena::GetQueryExecution
API et de transmettre la valeur de responseElements.queryExecutionId
from the CloudTrail log. Pour plus d'informations, consultez l'GetQueryExecutionaction dans le manuel Amazon Athena API Reference.
30 juin 2023
Date de publication : 30/06/2023
L'éditeur de requêtes Athena prend désormais en charge les suggestions de code de saisie anticipée pour une expérience de création de requêtes plus rapide. Vous pouvez désormais rédiger SQL des requêtes avec une précision et une efficacité accrues grâce aux fonctionnalités suivantes :
-
Au fur et à mesure que vous tapez, des suggestions apparaissent en temps réel pour les mots-clés, les variables locales, les extraits et les éléments du catalogue.
-
Lorsque vous tapez le nom d'une base de données ou d'une table suivi d'un point, l'éditeur affiche facilement une liste de tables ou de colonnes parmi lesquelles choisir.
-
Lorsque vous passez le pointeur sur une suggestion d'extrait, un résumé présente un bref aperçu de la syntaxe et de l'utilisation de l'extrait.
-
Pour améliorer la lisibilité du code, les mots-clés et leurs règles de mise en surbrillance ont également été mis à jour pour s'aligner sur la dernière syntaxe de Trino et Hive.
Cette caractéristique est activée par défaut. Vous pouvez activer ou désactiver cette fonctionnalité dans les paramètres de préférences de l'éditeur de code.
Pour essayer les suggestions de code dactylographiées dans l'éditeur de requêtes Athena, rendez-vous sur la console Athena à l'adresse. https://console.aws.amazon.com/athena/
29 juin 2023
Date de publication : 29/06/2023
-
Athena annonce la version 2.0.1.0 ODBC du pilote. Pour plus d'informations, consultez les notes de mise à jour de 2.0.1.0. Pour télécharger le nouveau pilote ODBC v2, voirTéléchargement du pilote ODBC 2.x. Pour obtenir des informations de connexion, veuillez consulter Amazon Athena ODBC 2.x.
-
Athena et ses fonctionnalités
sont désormais disponibles dans la région Moyen-Orient (UAE). Pour une liste complète des services Services AWS disponibles dans chacun d'entre eux Région AWS, voir AWS Services par région .
28 juin 2023
Date de publication : 28/06/2023
Vous pouvez désormais utiliser Amazon Athena pour interroger des objets restaurés à partir des classes de stockage Amazon S3 S3 Glacier Flexible Retrieval (anciennement Glacier) et S3 Glacier Deep Archive. Vous configurez cette fonctionnalité par table. La fonctionnalité est prise en charge uniquement pour les tables Apache Hive sur la version 3 du moteur Athena.
Pour de plus amples informations, veuillez consulter Interrogez les objets Amazon S3 Glacier restaurés.
12 juin 2023
Date de publication : 12/06/2023
Athena annonce les correctifs et améliorations suivants.
-
Horodatages de Parquet Reader : ajout de la prise en charge de la lecture des horodatages en tant que
bigint
(millis) pour Parquet Reader. Cette mise à jour fournit une parité avec la prise en charge de la version 2 du moteur Athena. -
EXPLAINANALYZE— Ajout du temps de lecture physique des entrées aux statistiques de requête et à la sortie de
EXPLAIN ANALYZE
. Pour de plus amples informations surEXPLAIN ANALYZE
, consultez Utiliser EXPLAIN et EXPLAIN ANALYZE dans Athéna. -
INSERT— Amélioration des performances de requête sur les tables écrites avec
INSERT
. Pour de plus amples informations surINSERT
, consultez INSERT INTO. -
Tables Delta Lake : correction d'un problème lié à
DROP TABLE
sur les tables Delta Lake qui empêchait leur suppression complète en cas de modifications simultanées.
8 juin 2023
Date de publication : 08/06/2023
Amazon Athena pour Apache Spark annonce les nouvelles fonctionnalités suivantes.
-
Prise en charge des bibliothèques et configurations Java personnalisées : vous pouvez désormais utiliser vos propres packages Java et une configuration personnalisée pour vos sessions Apache Spark dans Athena. Utilisez les propriétés Spark pour spécifier
.jar
des fichiers, des packages ou toute autre configuration personnalisée avec la console Athena AWS CLI, le ou l'Athena. API Pour de plus amples informations, veuillez consulter Utiliser les propriétés Spark pour définir une configuration personnalisée. -
Prise en charge des tables Apache Hudi, Apache Iceberg et Delta Lake : Athena pour Spark prend désormais en charge les formats de tables de stockage de lacs de données open source Apache Iceberg, Apache Hudi et Linux Foundation Delta Lake. Pour plus d'informations, consultez Utiliser des formats de table autres que Hive dans Athena pour Spark et les rubriques individuelles relatives à l'utilisation des tables Utiliser les tables Apache Iceberg dans Athena pour Spark, Utiliser les tables Apache Hudi dans Athena pour Spark et Utiliser les tables Delta Lake de la Linux Foundation dans Athena pour Spark dans Athena pour Spark.
-
Prise en charge du chiffrement pour Apache Spark : dans Athena pour Spark, vous pouvez désormais activer le chiffrement des données en transit entre les nœuds Spark et des données locales au repos stockées sur disque par Spark. Pour activer le chiffrement Spark, vous pouvez utiliser la console Athena AWS CLI, le ou l'Athena. API Pour de plus amples informations, veuillez consulter Activer le chiffrement Apache Spark.
Pour plus d'informations sur Amazon Athena pour Apache Spark, consultez Utiliser Apache Spark dans Amazon Athena.
2 juin 2023
Date de publication : 02/06/2023
Vous pouvez désormais supprimer les réservations de capacité dans Athéna et utiliser des AWS CloudFormation modèles pour spécifier les réservations de capacité d'Athéna.
-
Suppression de réserves de capacité : vous pouvez désormais supprimer les réserves de capacité annulées dans Athena. La réserve doit être annulée avant de pouvoir être supprimée. La suppression d'une réserve de capacité entraîne la suppression immédiate de la réserve de votre compte. La réservation supprimée ne peut plus être référencée, y compris par sonARN. Pour supprimer une réservation, vous pouvez utiliser la console Athena ou l'Athena. API Pour plus d'informations, consultez Supprimer une réservation de capacité le guide de l'utilisateur Amazon Athena et le manuel de DeleteCapacityReservationréférence Amazon API Athena.
-
Utiliser AWS CloudFormation des modèles pour les réservations de capacité — Vous pouvez désormais utiliser des AWS CloudFormation modèles pour spécifier les réservations de capacité d'Athena à l'aide de la
AWS::Athena::CapacityReservation
ressource. Pour plus d'informations, consultez AWS: :Athena : : CapacityReservation dans le guide de l'AWS CloudFormation utilisateur.
Pour plus d'informations sur l'utilisation des réserves de capacité pour allouer votre capacité dans Athena, consultez Gérer la capacité de traitement des requêtes.
25 mai 2023
Date de publication : 25/05/2023
Athena a publié des mises à jour du connecteur de source de données qui améliorent les performances des requêtes fédérées. Les nouvelles optimisations de la poussée vers le bas et le filtrage dynamique permettent d'effectuer davantage d'opérations dans la base de données source plutôt que dans Athena. Ces optimisations réduisent la durée d'exécution des requêtes et la quantité de données analysées. Ces améliorations nécessitent la version 3 du moteur Athena.
Les connecteurs suivants ont été mis à jour :
Pour de plus amples informations sur la mise à niveau des connecteurs de source de données, consultez Mettre à jour un connecteur de source de données.
18 mai 2023
Date de publication : 18/05/2023
Vous pouvez désormais l'utiliser AWS PrivateLink pour les connexions IPv6 entrantes vers Amazon Athena.
Amazon Athena a étendu sa prise en charge des connexions entrantes via les points de terminaison du protocole Internet version 6 (IPv6) pour inclure. AWS PrivateLink
La croissance rapide d'Internet épuise la disponibilité des adresses du protocole Internet version 4 (IPv4). IPv6multiplie par plusieurs le nombre d'adresses disponibles afin que vous n'ayez plus à gérer les espaces d'adressage qui se chevauchent dans votreVPCs. Avec cette version, vous pouvez désormais combiner les avantages de l'IPv6adressage avec les avantages en termes de sécurité et de performances de AWS PrivateLink.
Pour vous connecter par programmation à un AWS service, vous pouvez utiliser le AWS CLI
15 mai 2023
Date de publication : 15/05/2023
Athena annonce la sortie des connecteurs Apache Spark DataSource V2 (DSV2) pour DynamoDB, Logs, CloudWatch Metrics et. CloudWatch AWS CMDB Utilisez les nouveaux DSV2 connecteurs pour interroger ces sources de données à l'aide de Spark. DSV2les connecteurs utilisent les mêmes paramètres que leurs connecteurs fédérés Athena correspondants. Les DSV2 connecteurs s'exécutent directement sur les serveurs de Spark et vous n'avez pas besoin de déployer une fonction Lambda pour les utiliser.
Pour de plus amples informations, veuillez consulter Utilisation de connecteurs de source de données pour Apache Spark.
10 mai 2023
Date de publication : 10/05/2023
A publié le pilote ODBC 1.1.20 pour Athena.
Fonctionnalités et améliorations :
-
Prise en charge du remplacement des point de terminaison Lake Formation.
-
Le plugin ADFS d'authentification dispose d'un nouveau paramètre permettant de définir la valeur Relying Party (
LoginToRP
). -
AWS mises à jour de la bibliothèque.
Correctifs de bogue :
-
Échec de l'annulation de l'allocation de l'instruction préparée lorsque la méthode
SQLPrepare()
n'a pas été soumise. -
Erreur lors de la liaison des paramètres de l'instruction préparée lors de la conversion d'un type C en SQL type.
-
Impossible de renvoyer les données quand les requêtes
EXPLAIN
etEXPLAIN ANALYZE
utilisaientSQLPrepare()
etSQLExecute()
.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec ODBC.
8 mai 2023
Date de publication : 08/05/2023
Athena annonce les correctifs et améliorations suivants.
-
Intégration à Hudi mise à jour : Athena a mis à jour son intégration à Apache Hudi. Vous pouvez désormais utiliser Athena pour interroger les tables Hudi 0.12.2 et le listage des métadonnées Hudi pour les tables Hudi est désormais pris en charge. Pour plus d'informations, consultez Interrogez les ensembles de données Apache Hudi et Utilisez les métadonnées Hudi pour améliorer les performances.
-
Correctif de conversion d'horodatage : correction de la gestion des conversions d'horodatage vers un type de données de moindre précision. Auparavant, la version 3 du moteur Athena arrondissait incorrectement la valeur au type de cible au lieu de la tronquer lors de la conversion.
Les exemples suivants illustrent la gestion incorrecte avant le correctif.
Exemple 1 : conversion d'un horodatage en microsecondes en millisecondes
Exemples de données
A, 2020-06-10 15:55:23.383 B, 2020-06-10 15:55:23.382 C, 2020-06-10 15:55:23.383345 D, 2020-06-10 15:55:23.383945 E, 2020-06-10 15:55:23.383345734 F, 2020-06-10 15:55:23.383945278
La requête suivante tente de récupérer les horodatages correspondant à une valeur spécifique.
SELECT * FROM table WHERE timestamps.col = timestamp'2020-06-10 15:55:23.383'
La requête renvoyait les résultats suivants.
A, 2020-06-10 15:55:23.383 C, 2020-06-10 15:55:23.383 E, 2020-06-10 15:55:23.383
Avant le correctif, Athena n'incluait pas les valeurs
2020-06-10 15:55:23.383945
ou2020-06-10 15:55:23.383945278
parce qu'elles avaient été arrondies à2020-06-10 15:55:23.384
.Exemple 2 : conversion d'un horodatage en date
La requête suivante renvoyait un résultat erroné.
SELECT date(timestamp '2020-12-31 23:59:59.999')
Résultat
2021-01-01
Avant le correctif, Athena arrondissait la valeur, avançant ainsi la journée. Ces valeurs sont désormais tronquées au lieu d'être arrondies.
28 avril 2023
Date de publication : 28/04/2023
Vous pouvez désormais utiliser les réservations de capacité sur Amazon Athena pour exécuter des SQL requêtes sur une capacité de calcul entièrement gérée.
la capacité allouée fournit des capacités de gestion des charges de travail qui vous aident à hiérarchiser, contrôler et mettre à l'échelle vos charges de travail interactives les plus importantes. Vous pouvez ajouter une capacité à tout moment pour augmenter le nombre de requêtes que vous pouvez exécuter simultanément, contrôler les charges de travail utilisant cette capacité et partager la capacité entre les charges de travail.
Pour de plus amples informations, veuillez consulter Gérer la capacité de traitement des requêtes. Pour obtenir des informations sur la tarification, consultez la page Tarification Amazon Athena
17 avril 2023
Date de publication : 17/04/2023
Athena publie la version 2.0.36 JDBC du pilote. Le pilote inclut de nouvelles fonctionnalités et a résolu un problème.
Nouvelles fonctionnalités
-
Vous pouvez désormais utiliser des identifiants de parties utilisatrices personnalisables avec l'authentification AD FS.
-
Vous pouvez désormais ajouter le nom de l'application qui utilise le connecteur à la chaîne de l'agent utilisateur.
Problèmes résolus
-
Correction d'une erreur qui se produisait lors de l'utilisation de
getSchema()
pour récupérer un schéma inexistant.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
14 avril 2023
Date de publication : 20/06/2023
Athena annonce les correctifs et améliorations suivants.
-
Lorsque vous convertissez une chaîne en horodatage, un espace est requis entre le jour et l'heure ou le fuseau horaire. Pour de plus amples informations, veuillez consulter Espace requis entre les valeurs de date et d'heure lors de la conversion d'une chaîne en un horodatage.
-
Suppression d'un changement critique dans la façon dont la précision de l'horodatage était gérée. Pour garantir la cohérence entre les versions 2 et 3 du moteur Athena, la précision de l'horodatage est désormais définie par défaut en millisecondes au lieu de microsecondes.
-
Athena impose désormais systématiquement l'accès au compartiment de sortie des requêtes lorsqu'elle exécute des requêtes. Assurez-vous que tous les IAM principaux qui exécutent l'StartQueryExecutionaction disposent de l'GetBucketLocationautorisation S3 : sur le compartiment de sortie de la requête.
4 avril 2023
Date de publication : 04/04/2023
Vous pouvez désormais utiliser Amazon Athena pour créer et interroger des vues sur des sources de données fédérées. Utilisez une vue fédérée unique pour interroger plusieurs tables externes ou sous-jeux de données. Cela simplifie les SQL tâches requises et vous donne la flexibilité de masquer les sources de données des utilisateurs finaux qui doivent les utiliser SQL pour interroger les données.
Pour plus d’informations, consultez Travaillez avec des vues et Utiliser des requêtes fédérées.
30 mars 2023
Date de publication : 30/03/2023
Amazon Athena annonce la disponibilité d'Amazon Athena pour Apache Spark dans des Régions AWS supplémentaires.
Cette version étend la disponibilité d'Amazon Athena pour Apache Spark pour inclure l'Asie-Pacifique (Mumbai), l'Asie-Pacifique (Singapour), l'Asie-Pacifique (Sydney) et l'Europe (Francfort).
Pour plus d'informations sur Amazon Athena pour Apache Spark, consultez Utiliser Apache Spark dans Amazon Athena.
28 mars 2023
Date de publication : 28/03/2023
Athena annonce les correctifs et améliorations suivants.
-
Dans les réponses aux API actions
GetQueryExecution
etBatchGetQueryExecution
Athena, le nouveausubStatementType
champ indique le type de requête exécutée (par exemple,,SELECT
,INSERT
UNLOAD
CREATE_TABLE
, ouCREATE_TABLE_AS_SELECT
). -
Correction d'un bogue qui entraînait un chiffrement incorrect des fichiers manifestes pour les opérations d'écriture d'Apache Hive.
-
La version 3 du moteur Athena gère désormais correctement les valeurs
NaN
etInfinity
dans la fonctionapprox_percentile
. La fonctionapprox_percentile
renvoie le percentile approximatif d'un jeu de données au pourcentage donné.La version 2 du moteur Athena traite incorrectement
NaN
comme une valeur supérieure àInfinity
. La version 3 du moteur Athena gère désormaisNaN
etInfinity
conformément au traitement de ces valeurs dans d'autres fonctions analytiques et statistiques. Les points suivants décrivent le nouveau comportement de manière plus détaillée.-
Si
NaN
est présent dans le jeu de données, Athena renvoieNaN
. -
Si
NaN
n'est pas présente, mais queInfinity
est présent, Athena traiteInfinity
comme un très grand nombre. -
Si plusieurs valeurs
Infinity
sont présentes, Athena les traite comme le même très grand nombre. Si nécessaire, Athena renvoieInfinity
. -
Si un seul jeu de données contient les deux -
Infinity
et-Double.MAX_VALUE
- et qu'un résultat en percentile est-Double.MAX_VALUE
, Athena renvoie-Infinity
. -
Si un seul jeu de données contient les deux -
Infinity
etDouble.MAX_VALUE
- et qu'un résultat en percentile estDouble.MAX_VALUE
, Athena renvoieInfinity
. -
Pour exclure
Infinity
etNaN
d'un calcul, utilisez la fonctionis_finite()
, comme dans l'exemple suivant.approx_percentile(x, 0.5) FILTER (WHERE is_finite(x))
-
27 mars 2023
Date de publication : 27/03/2023
Vous pouvez désormais spécifier un niveau de chiffrement minimal pour les SQL groupes de travail Athena dans Amazon Athena. Cette fonctionnalité garantit que les résultats de toutes les requêtes du SQL groupe de travail Athena sont chiffrés au niveau de cryptage que vous spécifiez ou supérieur. Vous pouvez choisir entre plusieurs niveaux de puissance de chiffrement pour protéger vos données. Pour configurer le niveau de chiffrement minimal que vous souhaitez, vous pouvez utiliser la console Athena, AWS CLI API, ou. SDK
La fonctionnalité de chiffrement minimum n'est pas disponible pour les groupes de travail compatibles avec Apache Spark. Pour de plus amples informations, veuillez consulter Configuration du chiffrement minimal pour un groupe de travail.
17 mars 2023
Date de publication : 17/03/2023
Athena annonce les correctifs et améliorations suivants.
-
Correction d'un problème lié au connecteur Amazon Athena DynamoDB en raison duquel les requêtes échouaient et le message d'erreur ne
KeyConditionExpressions devait contenir qu'une seule
condition par clé.Ce problème se produit car la version 3 du moteur Athena reconnaît la possibilité de pousser vers le bas davantage de types de prédicats que la version 2 du moteur Athena. Dans la version 3 du moteur Athena, des clauses telles que
some_column LIKE 'someprefix%
sont poussées vers le bas sous forme de prédicats de filtre qui appliquent des limites inférieure et supérieure à une colonne donnée. La version 2 du moteur Athena n'a pas poussé ces prédicats vers le bas. Dans la version 3 du moteur Athena, lorsquesome_column
est une colonne de clé de tri, le moteur pousse le prédicat du filtre vers le connecteur DynamoDB. Le prédicat de filtre est ensuite redirigé vers le service DynamoDB. DynamoDB ne prenant en charge qu'une seule condition de filtre sur une clé de tri, DynamoDB renvoie l'erreur.Pour résoudre ce problème, mettez à jour votre connecteur Amazon Athena DynamoDB vers la version 2023.11.1. Pour obtenir des instructions sur la mise à jour du connecteur, consultez Mettre à jour un connecteur de source de données.
8 mars 2023
Date de publication : 08/03/2023
Athena annonce les correctifs et améliorations suivants.
-
Correction d'un problème lié aux requêtes fédérées qui entraînait l'envoi des valeurs des prédicats d'horodatage sous forme de microsecondes au lieu de millisecondes.
15 février 2023
Date de publication : 15/02/2023
Athena annonce les correctifs et améliorations suivants.
-
Vous pouvez désormais utiliser le chiffrement côté client afin de chiffrer les données dans Amazon S3 pour les opérations d'écriture d'Iceberg.
-
Correction d'un problème qui affectait le chiffrement côté serveur dans Amazon S3 pour les opérations d'écriture d'Iceberg.
31 janvier 2023
Date de publication : 31/01/2023
Vous pouvez désormais utiliser Amazon Athena pour interroger les données dans Google Cloud Storage. Comme Amazon S3, Google Cloud Storage est un service géré qui stocke les données dans des compartiments. Utilisez le connecteur Athena pour Google Cloud Storage pour exécuter des requêtes fédérées interactives sur vos données externes.
Pour de plus amples informations, veuillez consulter Connecteur Amazon Athena Google Cloud Storage.
20 janvier 2023
Date de publication : 20/01/2023
Vous pouvez désormais consulter une documentation complète sur la prise en charge de la compression Athena. Des rubriques individuelles ont été ajoutées pour Compression de la table Hive compression de la table Iceberg, et ZSTDniveaux de compression.
Pour de plus amples informations, veuillez consulter Utiliser la compression dans Athena.
3 janvier 2023
Date de publication : 03/01/2023
Athena annonce les mises à jour suivantes :
-
Commandes supplémentaires pour les métastores Hive – Vous pouvez utiliser Athena pour vous connecter à votre métastore Apache Hive autogéré en tant que catalogue de métadonnées et interroger des données stockées dans Amazon S3. Dans cette version, vous pouvez utiliser
CREATE TABLE AS
(CTAS) et 12 commandes supplémentaires du langage de définition des données (DDL) pour interagir avec le métastore Apache Hive.INSERT INTO
Vous pouvez gérer vos schémas Hive Metastore directement depuis Athena à l'aide de cet ensemble étendu de fonctionnalités. SQLPour de plus amples informations, veuillez consulter Utiliser un métastore Hive externe.
-
JDBCversion du pilote 2.0.35 — Athena publie JDBC la version 2.0.35 du pilote. Le pilote JDBC 2.0.35 contient les mises à jour suivantes :
-
Le pilote utilise désormais les bibliothèques suivantes pour l'JSONanalyseur Jackson.
-
jackson-annotations 2.14.0 (auparavant 2.13.2)
-
jackson-core 2.14.0 (auparavant 2.13.2)
-
jackson-databind 2.14.0 (auparavant 2.13.2.2)
-
-
Support pour JDBC la version 4.1 a été interrompu.
Pour plus d'informations et pour télécharger le nouveau pilote, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec JDBC.
-
Notes de publication d'Athena pour 2022
14 décembre 2022
Date de publication : 14/12/2022
Vous pouvez désormais utiliser le connecteur Amazon Athena pour Kafka afin d'exécuter des SQL requêtes sur des données en streaming. Par exemple, vous pouvez exécuter des requêtes analytiques sur des données de streaming en temps réel dans Amazon Managed Streaming for Apache Kafka MSK (Amazon) et les associer aux données historiques de votre lac de données dans Amazon S3.
Le connecteur Amazon Athena pour Kafka prend en charge les requêtes sur plusieurs moteurs de streaming. Vous pouvez utiliser Athena pour exécuter des SQL requêtes sur des clusters MSK provisionnés et sans serveur Amazon, sur des déploiements Kafka autogérés et sur des données en streaming dans Confluent Cloud.
Pour de plus amples informations, veuillez consulter Connecteur Amazon Athena pour MSK.
2 décembre 2022
Date de publication : 02/12/2022
Athena publie la version 2.0.34 JDBC du pilote. Le pilote JDBC 2.0.34 inclut les nouvelles fonctionnalités et les problèmes résolus suivants :
-
Prise en charge de la réutilisation des résultats des requêtes – Vous pouvez désormais réutiliser les résultats de requêtes exécutées précédemment jusqu'à une limite de temps que vous spécifiez, au lieu de demander à Athena de recalculer les résultats à chaque exécution de la requête. Pour plus d'informations, consultez le guide d'installation et de configuration, disponible sur la page de JDBC téléchargement, etRéutiliser les résultats des requêtes dans Athena.
-
InstanceMetadata Support Ec2 — Le JDBC pilote prend désormais en charge la méthode InstanceMetadata d'authentification Ec2 à l'aide de profils d'IAMinstance.
-
Correction d'une exception basée sur les caractères – Correction d'une exception qui se produisait avec les requêtes contenant certains caractères linguistiques.
-
Correction de vulnérabilité — Correction d'une vulnérabilité liée aux AWS dépendances fournies avec le connecteur.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
30 novembre 2022
Date de publication : 30/11/2022
Vous pouvez désormais créer et exécuter de manière interactive des applications Apache Spark et des blocs-notes compatibles Jupyter sur Athena. Exécutez des analyses de données sur Athena à l'aide de Spark sans avoir à planifier, configurer ou gérer les ressources. Soumettez le code Spark pour traitement et recevez directement les résultats. Utilisez l'expérience simplifiée du bloc-notes dans la console Amazon Athena pour développer des applications Apache Spark en utilisant Python ou Utiliser le bloc-notes Athena APIs.
Apache Spark fonctionne sur Amazon Athena sans serveur et offre une mise à l'échelle automatique et à la demande qui permet d'obtenir un calcul instantané pour répondre à l'évolution des volumes de données et des exigences de traitement.
Pour de plus amples informations, veuillez consulter Utiliser Apache Spark dans Amazon Athena.
18 novembre 2022
Date de publication : 18/11/2022
Vous pouvez désormais utiliser le connecteur Amazon Athena pour IBM Db2 pour interroger Db2 depuis Athena. Par exemple, vous pouvez exécuter des requêtes analytiques sur un entrepôt des données sur Db2 et un lac de données sur Amazon S3.
Le connecteur Db2 d'Amazon Athena expose plusieurs options de configuration par le biais de variables d'environnement Lambda. Pour plus d'informations sur les options de configuration, les paramètres, les chaînes de connexion, le déploiement et les limitations, voir Connecteur Amazon Athena pour Db2 IBM.
17 novembre 2022
Date de publication : 17/11/2022
La prise en charge d'Apache Iceberg dans la version 3 du moteur Athena offre désormais les fonctionnalités de transaction ACID améliorées suivantes :
-
ORCet support Avro : créez des tables Iceberg à l'aide des formats de fichier Apache Avro
et Apache basés sur des ORC lignes et des colonnes. La prise en charge de ces formats s'ajoute à la prise en charge existante de Parquet. -
MERGEINTO— Utilisez la
MERGE INTO
commande pour fusionner efficacement les données à grande échelle.MERGE INTO
combine lesDELETE
opérationsINSERT
UPDATE
, et en une seule transaction. Cela permet de réduire la charge de traitement dans votre pipeline de données et de réduire le temps SQL d'écriture. Pour plus d’informations, consultez Mettre à jour les données de la table Iceberg et MERGE INTO. -
CTASet VIEW support — Utilisez les
CREATE VIEW
instructionsCREATE TABLE AS SELECT
(CTAS) et avec les tables Iceberg. Pour plus d’informations, consultez CREATE TABLE AS et CREATE VIEW and CREATE DIALECT VIEW. -
VACUUMsupport — Vous pouvez utiliser
VACUUM
cette instruction pour optimiser votre lac de données en supprimant les instantanés et les données qui ne sont plus nécessaires. Vous pouvez utiliser cette fonctionnalité pour améliorer les performances de lecture et répondre aux exigences réglementaires telles que GDPR. Pour plus d’informations, consultez Optimisez les tables Iceberg et VACUUM.
Ces nouvelles fonctionnalités nécessitent la version 3 du moteur Athena et sont disponibles dans toutes les régions où le service Athena est pris en charge. Vous pouvez les utiliser avec la console Athena
Pour plus d'informations sur l'utilisation d'Iceberg dans Athena, voir Interrogez les tables Apache Iceberg.
14 novembre 2022
Date de publication : 14/11/2022
Amazon Athena prend désormais en charge les IPv6 points de terminaison pour les connexions entrantes que vous pouvez utiliser pour appeler les fonctions Athena. IPv6 Vous pouvez utiliser cette fonctionnalité pour répondre aux exigences de IPv6 conformité. Il élimine également le besoin d'équipement réseau supplémentaire pour gérer la traduction d'adresses entre IPv4 etIPv6.
Pour utiliser cette fonctionnalité, configurez vos applications de manière à utiliser les nouveaux points de terminaison à double pile Athena, qui prennent en charge les deux. IPv4 IPv6 Les points de terminaison à double pile utilisent le format athena.
. Par exemple, le point de terminaison à double pile dans la région USA Est (Virginie du Nord) est region
.api.awsathena.us-east-1.api.aws
.
Lorsque vous envoyez une demande à un point de terminaison Athena à double pile, le point de terminaison correspond à IPv6 une adresse ou à IPv4 une adresse en fonction du protocole utilisé par votre réseau et votre client. Pour vous connecter par programmation à un AWS service, vous pouvez utiliser le AWS CLI
Pour en savoir plus sur les points de terminaison du service, voir points de terminaison de service AWS. Pour en savoir plus sur les points de terminaison du service Athena, voir Points de terminaison et quotas d'Amazon Athena dans la documentation AWS .
Vous pouvez utiliser les nouveaux points de terminaison à double pile d'Athena pour les connexions entrantes sans coût supplémentaire. Les points de terminaison à double pile sont généralement disponibles dans toutes les Régions AWS.
11 novembre 2022
Date de publication : 11/11/2022
Athena annonce les correctifs et améliorations suivants.
-
Contrôle d'accès précis Lake Formation étendu – Vous pouvez désormais utiliser des politiques de contrôle d'accès précis AWS Lake Formation
dans les requêtes Athena pour les données stockées dans n'importe quel format de fichier ou de table pris en charge. Vous pouvez utiliser un contrôle d'accès précis dans Lake Formation pour restreindre l'accès aux données des résultats des requêtes à l'aide de filtres de données afin de garantir la sécurité au niveau des colonnes, des lignes et des cellules. Les formats de table pris en charge par Athena sont Apache Iceberg, Apache Hudi et Apache Hive. Le contrôle d'accès précis étendu est disponible dans toutes les régions prises en charge par Athena. La prise en charge étendue des formats de table et de fichier nécessite Version 3 du moteur Athena, qui offre de nouvelles fonctionnalités et améliore les performances des requêtes , mais ne change pas la façon dont vous configurez les politiques de contrôle d'accès précis dans Lake Formation. L'utilisation de ce contrôle d'accès précis étendu dans Athena a les implications suivantes :
-
EXPLAIN— Les informations de filtrage des lignes ou des cellules définies dans Lake Formation et les informations statistiques des requêtes ne sont pas affichées dans la sortie de
EXPLAIN
etEXPLAIN ANALYZE
. Pour plus d'informations surEXPLAIN
dans Athena, voir Utiliser EXPLAIN et EXPLAIN ANALYZE dans Athéna. -
Métastores Hive externes – Les colonnes cachées d'Apache Hive ne peuvent pas être utilisées pour le filtrage du contrôle d'accès précis, et les tables système cachées d'Apache Hive ne sont pas prises en charge par le contrôle d'accès précis. Pour plus d’informations, consultez Considérations et restrictions dans la rubrique Utiliser un métastore Hive externe.
-
Statistiques des requêtes – Les informations relatives au nombre de lignes d'entrée et de sortie et à la taille des données ne figurent pas dans les statistiques des requêtes Athena lorsque des filtres de niveau ligne sont définis dans Lake Formation. Pour plus d'informations sur l'affichage des statistiques relatives aux requêtes Athena, reportez-vous Afficher les statistiques et les détails d'exécution des requêtes terminées aux sections et. GetQueryRuntimeStatistics
-
Groupes de travail – Les utilisateurs du même groupe de travail Athena peuvent voir les données que le contrôle d'accès précis de Lake Formation a configurées pour être accessibles au groupe de travail. Pour plus d'informations sur l'utilisation d'Athena pour interroger des données enregistrées dans Lake Formation,voir Utilisez Athena pour interroger les données enregistrées auprès de AWS Lake Formation.
Pour en savoir plus sur l'utilisation du contrôle d'accès précis dans Lake Formation, voir Gérer le contrôle d'accès précis à l'aide de AWS Lake Formation
sur le blog AWS Big Data. -
-
Requête fédérée Athena – La requête fédérée d'Athena préserve désormais la casse originale des noms de champs dans les objets
struct
. Auparavant, les noms des champsstruct
étaient automatiquement mis en minuscules.
8 novembre 2022
Date de publication : 08/11/2022
Vous pouvez désormais utiliser la fonction de mise en cache de la réutilisation des résultats des requêtes pour accélérer les requêtes répétées dans Athena. Une requête répétée est une SQL requête identique à une requête soumise récemment qui produit les mêmes résultats. Lorsque vous devez exécuter plusieurs requêtes identiques, la mise en cache en vue de la réutilisation des résultats peut réduire le temps nécessaire à la production des résultats. La mise en cache en vue de la réutilisation des résultats permet également de réduire les coûts en diminuant le nombre d'octets analysés.
Pour de plus amples informations, veuillez consulter Réutiliser les résultats des requêtes dans Athena.
13 octobre 2022
Date de publication : 13/10/2022
Athena annonce la version 3 du moteur Athena.
Athena a amélioré son moteur de SQL requêtes pour inclure les dernières fonctionnalités du projet open source Trino
Pour de plus amples informations, veuillez consulter Version 3 du moteur Athena.
10 octobre 2022
Date de publication : 10/10/2022
Athena publie la version 2.0.33 JDBC du pilote. Le pilote JDBC 2.0.33 inclut les modifications suivantes :
-
Les nouvelles propriétés de version, de JDBC version et de nom du plugin du pilote ont été ajoutées à la chaîne user-agent dans la classe du fournisseur d'informations d'identification.
-
Les messages d'erreur ont été corrigés et les informations nécessaires ajoutées.
-
Les instructions préparées sont désormais désallouées si la connexion est fermée ou si l'exécution d'instruction préparée par Athena échoue.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
23 septembre 2022
Date de publication : 26/09/2022
Le connecteur Amazon Athena Neptune autorise désormais la mise en correspondance non sensible à la casse pour les noms de colonnes et de tables.
-
Le connecteur de source de données Neptune peut résoudre les noms de colonnes sur les tables Neptune qui utilisent la casse, même si les noms des colonnes sont tous en minuscules dans la table de AWS Glue. Pour activer ce comportement, définissez la variable d'environnement
enable_caseinsensitivematch
surtrue
dans la fonction Lambda du connecteur Neptune. -
Étant donné que seuls AWS Glue les noms de table en minuscules sont pris en charge, lorsque vous créez une AWS Glue table pour Neptune, spécifiez le paramètre de AWS Glue table.
"glabel" =
table_name
Pour plus d'informations sur le connecteur Neptune, veuillez consulter la rubrique Connecteur Amazon Athena pour Neptune.
13 septembre 2022
Date de publication : 13/09/2022
Athena annonce les correctifs et améliorations suivants.
-
Métastore Hive externe — Athena renvoie désormais
NULL
au lieu de lancer une exception lorsqu'uneWHERE
clause inclut une partition qui n'existe pas dans un métastore Hive externe (). EHMS Le nouveau comportement correspond à celui du AWS Glue Data Catalog. -
Requêtes paramétrées – Les valeurs dans les requêtes paramétrées peuvent désormais être envoyées au type de données
DOUBLE
. -
Apache Iceberg – Les opérations d’écriture sur des tables Iceberg aboutissent désormais lorsque le verrouillage d’objet est activé sur un compartiment Amazon S3.
31 août 2022
Date de publication : 31/08/2022
Amazon Athena annonce la disponibilité d’Athena et ses fonctions
Cette version étend la disponibilité d’Athena dans la région Asie-Pacifique pour inclure Asie-Pacifique (Hong Kong), Asie-Pacifique (Jakarta), Asie-Pacifique (Mumbai), Asie-Pacifique (Osaka), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Asie-Pacifique (Sydney) et Asie-Pacifique (Tokyo). Pour accéder à une liste complète des Services AWS disponibles dans ces régions et dans d'autres, consultez la Région AWS Liste des services régionaux
23 août 2022
Date de publication : 23/08/2022
La version v2022.32.1 de l'
-
Ajout de la prise en charge du connecteur de source de données Oracle Amazon Athena pour les connexions SSL basées aux instances AmazonRDS. Support limité au protocole Transport Layer Security (TLS) et à l'authentification du serveur par le client. L'authentification mutuelle n'étant pas prise en charge sur AmazonRDS, la mise à jour n'inclut pas la prise en charge de l'authentification mutuelle.
Pour de plus amples informations, veuillez consulter Connecteur Amazon Athena pour Oracle.
3 août 2022
Date de publication : 03/08/2022
Athena publie la version 2.0.32 JDBC du pilote. Le pilote JDBC 2.0.32 inclut les modifications suivantes :
-
La
User-Agent
chaîne envoyée à l'Athena SDK a été étendue pour contenir la version du pilote, la version de JDBC spécification et le nom du plugin d'authentification. -
Correction d'un
NullPointerException
qui était lancé lorsqu'aucune valeur n'était fournie pour le paramètreCheckNonProxyHost
. -
Correction d'un problème d'
login_url
analyse dans le plugin BrowserSaml d'authentification. -
Correction d'un problème d'hôte proxy qui survenait lorsque le paramètre
UseProxyforIdp
était défini surtrue
.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
1er août 2022
Date de publication : 01/08/2022
Athena annonce des améliorations apportées à l'Athena Query Federation et aux connecteurs de source de données SDK prédéfinis Athena. Les améliorations apportées sont les suivantes :
-
Analyse des structures : correction d'un problème d'
GlueFieldLexer
analyse dans l'Athena Query Federation SDK qui empêchait certaines structures complexes d'afficher toutes leurs données. Ce problème concernait les connecteurs basés sur l'Athena Query Federation. SDK -
AWS Glue tables — Ajout d'un support supplémentaire pour les types
set
etdecimal
colonnes dans AWS Glue les tableaux. -
Connecteur DynamoDB – Ajout de la possibilité d'ignorer la casse des noms d'attributs DynamoDB. Pour plus d'informations, voir
disable_projection_and_casing
dans la section Paramètres de la page Connecteur Amazon Athena pour DynamoDB.
Pour plus d'informations, consultez la version v2022.30.2 d'Athena
21 juillet 2022
Date de publication : 21/07/2022
Vous pouvez désormais analyser et déboguer vos requêtes à l'aide de mesures de performances et d'outils d'analyse de requêtes visuels interactifs dans la console Athena. Les données de performance des requêtes et les détails d'exécution peuvent vous aider à identifier les goulots d'étranglement dans les requêtes, à inspecter les opérateurs et les statistiques pour chaque étape d'une requête, à suivre le volume de données circulant entre les étapes et à valider l'impact des prédicats de requête. Vous pouvez désormais :
-
Accédez au plan d'exécution distribué et logique de votre requête en un seul clic.
-
Explorez les opérations à chaque étape avant que l'étape ne soit exécutée.
-
Visualisez les performances des requêtes terminées avec des mesures du temps passé dans les étapes de mise en file d'attente, de planification et d'exécution.
-
Obtenez des informations sur le nombre de lignes et la quantité de données sources traitées et sorties par votre requête.
-
Consultez les détails d'exécution granulaires de vos requêtes, présentés dans leur contexte et formatés sous forme de graphique interactif.
-
Utilisez des détails d'exécution précis au niveau de l'étape pour comprendre le flux de données dans votre requête.
-
Analysez les données de performance des requêtes par programmation à l'aide de la nouvelle APIs version pour obtenir des statistiques d'exécution des requêtes, également publiées aujourd'hui.
Pour savoir comment utiliser ces fonctionnalités dans le cadre de vos requêtes, regardez le didacticiel vidéo Optimize Amazon Athena Queries with New Query Analysis Tools
Pour obtenir la documentation, consultez Afficher les plans d'exécution des SQL requêtes et Afficher les statistiques et les détails d'exécution des requêtes terminées.
11 juillet 2022
Date de publication : 11/07/2022
Vous pouvez désormais exécuter des requêtes paramétrées directement depuis la console Athena ou API sans préparer SQL d'instructions à l'avance.
Lorsque vous exécutez des requêtes dans la console Athena dont les paramètres se présentent sous la forme de points d'interrogation, l'interface utilisateur vous invite désormais à saisir directement des valeurs pour les paramètres. Cela évite de devoir modifier les valeurs littérales dans l'éditeur de requête chaque fois que vous souhaitez exécuter la requête.
Si vous utilisez l'exécution améliorée des requêtesAPI, vous pouvez désormais fournir les paramètres d'exécution et leurs valeurs en un seul appel.
Pour plus d'informations, consultez Utiliser des requêtes paramétrées dans ce guide de l'utilisateur et l'article du Big Data Blog intitulé AWS
Utiliser des requêtes paramétrées Amazon Athena pour fournir des données en tant que service
8 juillet 2022
Date de publication : 08/07/2022
Athena annonce les correctifs et améliorations suivants.
-
Correction d'un problème lié à
DATE
la gestion de la conversion des colonnes pour les SageMaker points de terminaison (UDF) qui provoquait des échecs de requête.
6 juin 2022
Date de publication : 06/06/2022
Athena publie la version 2.0.31 JDBC du pilote. Le pilote JDBC 2.0.31 inclut les modifications suivantes :
-
problème de dépendance log4j – Résolution d'un message d'erreur
Cannot find driver class
(Impossible de trouver une classe de pilote) causé par une dépendance log4j.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
25 mai 2022
Date de publication : 25/05/2022
Athena annonce les correctifs et améliorations suivants.
-
Support Iceberg
-
Introduction d'un support pour les requêtes entre régions. Vous pouvez désormais interroger les tables Iceberg dans un Région AWS fichier différent de celui Région AWS que vous utilisez. Les requêtes entre régions ne sont pas prises en charge dans les régions de Chine.
-
Introduction d'un support pour la configuration du chiffrement côté serveur. Vous pouvez désormais utiliser SSE-S3/ SSE - KMS pour chiffrer les données issues des opérations d'écriture d'Iceberg dans Amazon S3.
Pour plus d'informations sur l'utilisation d'Apache Iceberg dans Athena, consultez Interrogez les tables Apache Iceberg.
-
-
JDBCVersion du pilote 2.0.30
Le pilote JDBC 2.0.30 pour Athena présente les améliorations suivantes :
-
Corrige un problème de course de données qui affectait les déclarations préparées paramétrisées.
-
Corrige un problème de démarrage d'application qui survenait dans les environnements de création Gradle.
Pour télécharger le pilote JDBC 2.0.30, les notes de version et la documentation, consultez. Connectez-vous à Amazon Athena avec JDBC
-
6 mai 2022
Date de publication : 06/05/2022
Publication des JDBC pilotes 2.0.29 et ODBC 1.1.17 pour Athena.
Ces pilotes comprennent les modifications suivantes :
-
Mise à jour du processus de lancement du navigateur de SAML plugins.
Pour plus d'informations sur ces changements et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, veuillez consulter Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
22 avril 2022
Date de publication : 22/04/2022
Athena annonce les correctifs et améliorations suivants.
-
Résolution d'un problème dans les index de partition et la fonction de filtrage
avec le cache de partition qui s'est produit lorsque les conditions suivantes ont été remplies : -
La
partition_filtering.enabled
clé a été définie surtrue
dans les AWS Glue propriétés d'une table. -
La même table a été utilisée plusieurs fois avec des valeurs de filtre de partition différentes.
-
21 avril 2022
Date de publication : 21/04/2022
Vous pouvez désormais utiliser Amazon Athena pour exécuter des requêtes fédérées sur de nouvelles sources de données, notamment Google BigQuery, Azure Synapse et Snowflake. Les nouveaux connecteurs de source de données incluent :
Pour une liste complète des sources de données prises en charge par Athena, consultez Connecteurs de source de données disponibles.
Pour faciliter la navigation dans les sources disponibles et la connexion à vos données, vous pouvez désormais rechercher, trier et filtrer les connecteurs disponibles à partir d'une mise à jour des sources de données dans la console Athena.
Pour en savoir plus sur l'interrogation de sources fédérées, veuillez consulter Utiliser la requête fédérée Amazon Athena et Utiliser des requêtes fédérées.
13 avril 2022
Date de publication : 13/04/2022
Athena publie la version 2.0.28 JDBC du pilote. Le pilote JDBC 2.0.28 inclut les modifications suivantes :
-
JWTsupport — Le pilote prend désormais en charge les jetons JSON Web (JWT) pour l'authentification. Pour plus d'informations sur JWT l'utilisation du JDBC pilote, consultez le guide d'installation et de configuration, téléchargeable depuis la page du JDBC pilote.
-
Bibliothèques Log4j mises à jour : le JDBC pilote utilise désormais les bibliothèques Log4j suivantes :
-
Log4j-api 2.17.1 (antérieurement 2.17.0)
-
Log4j-core 2.17.1 (antérieurement 2.17.0)
-
Log4j-jcl 2.17.2
-
-
Autres améliorations – Le nouveau pilote inclut également les améliorations et corrections de bugs suivantes :
-
La fonctionnalité des relevés préparés par Athéna est désormais disponible via. JDBC Pour plus d'informations sur les instructions préparées, consultez Utiliser des requêtes paramétrées.
-
La JDBC SAML fédération Athena est désormais fonctionnelle pour les régions de Chine.
-
Améliorations mineures supplémentaires.
-
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, consultez Connectez-vous à Amazon Athena avec JDBC.
30 mars 2022
Date de publication : 30/03/2022
Athena annonce les correctifs et améliorations suivants.
-
Interrogation entre régions : vous pouvez désormais utiliser Athena pour interroger des données situées dans un compartiment Amazon S3, Régions AWS notamment en Asie-Pacifique (Hong Kong), au Moyen-Orient (Bahreïn), en Afrique (Le Cap) et en Europe (Milan). Les requêtes entre régions ne sont pas prises en charge dans les régions de Chine.
-
Pour obtenir la liste des sites Régions AWS dans lesquels Athena est disponible, consultez la section Points de terminaison et quotas Amazon Athena.
-
Pour plus d'informations sur l'activation d'une Région AWS zone désactivée par défaut, consultez la section Activation d'une région.
-
Pour plus d'informations sur les requêtes entre régions, consultez Interrogation entre les régions.
-
18 mars 2022
Date de publication : 18/03/2022
Athena annonce les correctifs et améliorations suivants.
-
Dynamic filtering (Filtrage dynamique) – Dynamic filtering (Filtrage dynamique) a été amélioré pour les colonnes entières en appliquant efficacement le filtre à chaque registre d'une table correspondante.
-
Iceberg — Correction d'un problème qui entraînait des échecs lors de l'écriture de fichiers Iceberg Parquet de plus de 2 Go.
-
Uncompressed output (Sortie non compressée) – CREATE TABLE les instructions prennent désormais en charge l'écriture de fichiers non compressés. Pour écrire des fichiers non compressés, utilisez la syntaxe suivante :
-
CREATETABLE(fichier texte ouJSON) — Dans
TBLPROPERTIES
, spécifiezwrite.compression = NONE
. -
CREATETABLE(Parquet) — Dans
TBLPROPERTIES
, précisezparquet.compression = UNCOMPRESSED
. -
CREATETABLE(ORC) — Dans
TBLPROPERTIES
, spécifiezorc.compress = NONE
.
-
-
Compression — Correction d'un problème lié aux insertions de tables de fichiers texte qui créaient des fichiers compressés dans un format mais qui utilisaient une autre extension de fichier de format de compression lorsque des méthodes de compression autres que par défaut étaient utilisées.
-
Avro — Correction de problèmes survenus lors de la lecture de décimales de type fixe à partir de fichiers Avro.
2 mars 2022
Date de publication : 02/03/2022
Athena annonce les fonctions et améliorations suivantes.
-
Vous pouvez désormais accorder au propriétaire du compartiment Amazon S3 un contrôle total sur les résultats de la requête lorsque ACLscette option est activée pour le compartiment de résultats de requête. Pour de plus amples informations, veuillez consulter Spécifier l'emplacement des résultats de la requête.
-
Vous pouvez désormais mettre à jour les requêtes nommées existantes. Pour de plus amples informations, veuillez consulter Utiliser des requêtes enregistrées.
23 février 2022
Date de publication : 23/02/2022
Athena annonce les correctifs et améliorations de performances suivants.
-
Amélioration du traitement de la mémoire pour améliorer les performances et réduire les erreurs de mémoire.
-
Athena lit désormais les colonnes d'ORChorodatage contenant les informations de fuseau horaire stockées dans des pieds de page à bandes et écrit des ORC fichiers avec le fuseau horaire () dans les pieds de page. UTC Cela n'a d'impact sur le comportement des lectures d'ORChorodatage que si le ORC fichier à lire a été créé dans un environnement autre que le UTC fuseau horaire.
-
Correction des estimations incorrectes de la taille des tables de liens symboliques qui entraînaient des plans de requête sous-optimaux.
-
Les vues éclatées latérales peuvent désormais être interrogées dans la console Athena à partir de sources de données de métastore Hive.
-
Amélioration des messages d'erreur de lecture de Simple Storage Service (Amazon S3) pour inclure des informations plus détaillées sur les codes d'erreur de Simple Storage Service (Amazon S3).
-
Correction d'un problème en raison duquel les fichiers de sortie au ORC format devenaient incompatibles avec Apache Hive 3.1.
-
Correction d'un problème en raison duquel les noms de table entre guillemets échouaient dans certaines DML DDL requêtes.
15 février 2022
Date de publication : 15/02/2022
Amazon Athena a augmenté le quota de DML requêtes actives dans toutes les AWS régions. Les requêtes actives incluent à la fois les requêtes en cours d'exécution et en file d'attente. Grâce à cette modification, vous pouvez désormais avoir plus de DML requêtes actives qu'auparavant.
Pour plus d'informations sur les quotas de service Athena, consultez Service Quotas. Pour connaître les quotas de requête dans la région où vous utilisez Athena, consultez Points de terminaison et quotas Amazon Athena dans la Références générales AWS.
Pour surveiller l'utilisation de vos quotas, vous pouvez utiliser les statistiques CloudWatch d'utilisation. Athena publie la métrique ActiveQueryCount
dans l'espace de nom AWS/Usage
. Pour de plus amples informations, veuillez consulter Surveillez les statistiques d'utilisation d'Athena avec CloudWatch.
Après avoir examiné votre utilisation, vous pouvez utiliser la console Service Quotas
14 février 2022
Date de publication : 14/02/2022
Cette version ajoute le ErrorType
sous-champ à l'objet de AthenaErrorréponse dans l'action GetQueryExecutionAPIAthena.
Alors que le champ ErrorCategory
existant indique la source générale de l'échec d'une requête (système, utilisateur ou autre), le nouveau champ ErrorType
fournit des informations plus précises sur l'erreur qui s'est produite. Combinez les informations des deux champs pour mieux comprendre les causes de l'échec de la requête.
Pour de plus amples informations, veuillez consulter Catalogue d'erreurs Athena.
9 février 2022
Date de publication : 09/02/2022
L'ancienne console Athena n'est plus disponible. La nouvelle console d'Athena prend en charge toutes les fonctions de la console précédente, mais avec une interface plus facile à utiliser et moderne. Elle comprend de nouvelles fonctions qui améliorent l'expérience de développement de requêtes, d'analyse de données et de gestion de votre utilisation. Pour utiliser la nouvelle console Athena, rendez-vous sur. https://console.aws.amazon.com/athena/
8 février 2022
Date de publication : 08/02/2022
Propriétaire attendu du bucket : par mesure de sécurité supplémentaire, vous pouvez désormais éventuellement spécifier l' Compte AWS identifiant que vous pensez être le propriétaire du bucket d'emplacement de sortie des résultats de votre requête dans Athena. Si l'ID de compte du propriétaire du compartiment des résultats de la requête ne correspond pas à l'ID de compte que vous spécifiez, les tentatives de sortie vers le compartiment échoueront avec une erreur d'autorisation Simple Storage Service (Amazon S3). Vous pouvez définir ce paramètre au niveau du client ou du groupe de travail.
Pour de plus amples informations, veuillez consulter Spécifier l'emplacement des résultats de la requête.
28 janvier 2022
Date de publication : 28/01/2022
Athena annonce les améliorations suivantes des fonctions du moteur.
-
Apache Hudi : les requêtes d'instantané sur les tables Hudi Merge on Read (MoR) peuvent désormais lire les colonnes d'horodatage qui ont le type de données
INT64
. -
UNIONrequêtes : amélioration des performances et réduction de l'analyse des données pour certaines
UNION
requêtes analysant plusieurs fois la même table. -
Requêtes disjointes : amélioration des performances pour les requêtes qui ne comportent que des valeurs disjointes pour chaque colonne de partition du filtre.
-
Améliorations de la projection de partition
-
Plusieurs valeurs disjointes sont désormais autorisées dans la condition de filtre pour les colonnes de type
injected
. Pour de plus amples informations, veuillez consulter Type injecté. -
Amélioration des performances pour les colonnes de types basés sur des chaînes comme
CHAR
ouVARCHAR
, qui ne contiennent que des valeurs disjointes sur le filtre.
-
13 janvier 2022
Date de publication : 13/01/2022
Publication des JDBC pilotes 2.0.27 et ODBC 1.1.15 pour Athena.
Le pilote JDBC 2.0.27 inclut les modifications suivantes :
-
Le pilote a été mis à jour pour récupérer des catalogues externes.
-
Le numéro de version étendu du pilote est désormais inclus dans la
user-agent
chaîne dans le cadre de l'appel AthenaAPI.
Le pilote ODBC 1.1.15 inclut les modifications suivantes :
-
Corrige un problème lié aux seconds appels à
SQLParamData()
.
Pour plus d'informations sur ces changements et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, veuillez consulter Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
Notes de publication d'Athena pour 2021
26 novembre 2021
Date de publication : 26/11/2021
Athena annonce la prévisualisation publique des ACID transactions Athena, qui ajoutent des opérations d'écriture, de suppression, de mise à jour et de voyage dans le temps au langage de manipulation des données d'Athéna (). SQL DML ACIDLes transactions Athena permettent à plusieurs utilisateurs simultanés d'apporter des modifications fiables au niveau des lignes aux données Amazon S3. Basées sur le format de table Apache Iceberg
ACIDLes transactions Athena et la SQL syntaxe familière simplifient les mises à jour de vos données commerciales et réglementaires. Par exemple, pour répondre à une demande d'effacement de données, vous pouvez effectuer une SQL DELETE
opération. Pour effectuer des corrections d'enregistrement manuelles, vous pouvez utiliser une seule instruction UPDATE
. Pour récupérer des données qui ont été récemment supprimées, vous pouvez émettre des requêtes Time Travel en utilisant une instruction SELECT
. Les transactions Athena sont disponibles via la console, les API opérations et les pilotes d'Athena. ODBC JDBC
Pour de plus amples informations, veuillez consulter Utiliser les transactions Athena ACID.
24 novembre 2021
Date de publication : 24/11/2021
Athena annonce la prise en charge de la lecture et de l'écriture de données ZStandard
Pour plus d'informations sur la compression des données dans Athena, veuillez consulter Utiliser la compression dans Athena.
22 novembre 2021
Date de publication : 22/11/2021
Vous pouvez désormais gérer les AWS Step Functions flux de travail depuis la console Amazon Athena, ce qui facilite la création de pipelines de traitement des données évolutifs, l'exécution de requêtes basées sur une logique métier personnalisée, l'automatisation des tâches administratives et d'alerte, etc.
Step Functions est désormais intégré à la dernière génération de la console d'Athena, et vous pouvez l'utiliser pour visualiser un diagramme de flux interactif de vos machines à état qui invoquent Athena. Pour commencer, sélectionnez Workflows (Flux) dans le panneau de navigation de gauche. Si vous avez déjà des machines à états avec des requêtes Athena, sélectionnez une machine à états pour afficher un diagramme interactif du flux. Si vous débutez dans Step Functions, vous pouvez commencer en lançant un exemple de projet à partir de la console Athena et en le personnalisant en fonction de vos cas d'utilisation.
Pour plus d'informations, consultez Créer et orchestrer des ETL pipelines à l'aide d'Amazon Athena AWS Step Functions
18 novembre 2021
Date de publication : 18/11/2021
Athena annonce de nouvelles fonctions et améliorations.
-
Support spill-to-disk pour les requêtes d'agrégation contenant
DISTINCT
ORDER BY
, ou les deux, comme dans l'exemple suivant :SELECT array_agg(orderstatus ORDER BY orderstatus) FROM orders GROUP BY orderpriority, custkey
-
Résolution des problèmes de traitement de la mémoire pour les requêtes utilisant
DISTINCT
. Pour éviter les messages d'erreur tels queQuery exhausted resources at this scale factor (La requête a épuisé les ressources à ce facteur d'échelle.)
lorsque vous utilisez des requêtesDISTINCT
, choisissez des colonnes dont la cardinalité est faible pourDISTINCT
, ou réduisez la taille des données de la requête. -
Dans les requêtes
SELECT COUNT(*)
qui ne spécifient pas de colonne particulière, amélioration des performances et de l'utilisation de la mémoire en conservant uniquement le compte sans mise en mémoire tampon des lignes. -
Introduction des fonctions de chaîne suivantes.
-
translate(source, from, to)
: renvoie la chaînesource
avec les caractères présents dans la chaînefrom
remplacée par les caractères correspondants dans la chaîneto
. Si la chaînefrom
contient des doublons, seule la première occurrence est utilisée. Si le caractèresource
n'existe pas dans la chaînefrom
, le caractèresource
est copié sans traduction. Si l'index du caractère correspondant dans la chaînefrom
est supérieur à la longueur de la chaîneto
, le caractère est omis de la chaîne résultante. -
concat_ws(string0, array(varchar))
: renvoie la concaténation des éléments du tableau à l'aide destring0
comme séparateur. Sistring0
a la valeur NULL, la valeur de retour est NULL. Toutes les valeurs NULL du tableau sont ignorées.
-
-
Correction d'un bug dans lequel les requêtes échouaient lorsqu'elles tentaient d'accéder à un sous-champ manquant dans un
struct
. Les requêtes renvoient désormais une valeur NULL pour le sous-champ manquant. -
Correction d'un problème de hachage incohérent pour le type de données décimales.
-
Correction d'un problème qui entraînait l'épuisement des ressources lorsqu'il y avait trop de colonnes dans une partition.
17 novembre 2021
Date de publication : 17/11/2021
Amazon Athena
Lors de l'interrogation de tables partitionnées, Athena récupère et filtre les partitions de table disponibles vers le sous-ensemble correspondant à votre requête. À mesure que de nouvelles données et partitions sont ajoutées, il faut plus de temps pour traiter les partitions et le temps d'exécution des requêtes peut augmenter. Pour optimiser le traitement des partitions et améliorer les performances des requêtes sur des tables hautement partitionnées, Athena prend désormais en charge les index de partition AWS Glue.
Pour de plus amples informations, veuillez consulter Optimisez les requêtes grâce à l'indexation et au filtrage des AWS Glue partitions.
16 novembre 2021
Date de publication : 16/11/2021
La nouvelle console Amazon Athena
-
Réorganiser, accéder à ou fermer plusieurs onglets de requête à partir d'une barre d'onglets de requête redessinée.
-
Lisez et modifiez les requêtes plus facilement grâce à une mise en forme améliorée SQL du texte.
-
Copier les résultats de la requête dans votre presse-papiers en plus de télécharger le jeu de résultats complet.
-
Trier l'historique de vos requêtes, vos requêtes enregistrées et vos groupes de travail, et choisir les colonnes à afficher ou à masquer.
-
Utiliser une interface simplifiée pour configurer les sources de données et les groupes de travail en moins de clics.
-
Définir les préférences d'affichage des résultats de la requête, de l'historique des requêtes, de l'encapsulation des lignes, etc.
-
Augmenter votre productivité grâce à des nouveaux et meilleurs raccourcis clavier et à la documentation produit intégrée.
Avec l'annonce d'aujourd'hui, la console repensée
Si vous le souhaitez, vous pouvez utiliser la console précédente en vous connectant à votre console Compte AWS, en choisissant Amazon Athena et en désélectionnant New Athena Experience dans le panneau de navigation de gauche.
12 novembre 2021
Date de publication : 12/11/2021
Vous pouvez désormais utiliser Amazon Athena pour exécuter des requêtes fédérées sur des sources de données situées dans un autre compte AWS que le vôtre. Jusqu'à aujourd'hui, l'interrogation de ces données nécessitait que la source de données et son connecteur utilisent les mêmes informations Compte AWS que l'utilisateur qui a demandé les données.
En tant qu'administrateur de données, vous pouvez activer les requêtes fédérées entre comptes en partageant votre connecteur de données avec le compte d'un analyste de données. En tant qu'analyste de données, vous pouvez ajouter un connecteur de données qu'un administrateur de données a partagé avec vous à votre compte. Les modifications de configuration apportées au connecteur dans le compte d'origine s'appliquent automatiquement au connecteur partagé.
Pour plus d'informations sur l'activation des requêtes fédérées entre comptes, veuillez consulter Activer les requêtes fédérées entre comptes. Pour en savoir plus sur l'interrogation de sources fédérées, veuillez consulter Utiliser la requête fédérée Amazon Athena et Utiliser des requêtes fédérées.
2 novembre 2021
Date de publication : 02/11/2021
Vous pouvez désormais utiliser l'EXPLAIN ANALYZE
instruction dans Athena pour afficher le plan d'exécution distribué et le coût de chaque opération pour vos SQL requêtes.
Pour de plus amples informations, veuillez consulter Utiliser EXPLAIN et EXPLAIN ANALYZE dans Athéna.
29 octobre 2021
Date de publication : 29/10/2021
Athena publie les pilotes JDBC 2.0.25 et ODBC 1.1.13 et annonce des fonctionnalités et des améliorations.
JDBCet ODBC pilotes
Sortie des JDBC pilotes 2.0.25 et ODBC 1.1.13 pour Athena. Les deux pilotes prennent en charge l'authentification SAML multifactorielle du navigateur, qui peut être configurée pour fonctionner avec n'importe quel fournisseur SAML 2.0.
Le pilote JDBC 2.0.25 inclut les modifications suivantes :
-
Support pour l'SAMLauthentification par navigateur. Le pilote inclut un SAML plugin de navigateur qui peut être configuré pour fonctionner avec n'importe quel fournisseur SAML 2.0.
-
Support pour les AWS Glue API appels. Vous pouvez utiliser le paramètre
GlueEndpointOverride
pour remplacer le point de terminaison AWS Glue . -
Modification du classpath de
com.simba.athena.amazonaws
àcom.amazonaws
.
Le pilote ODBC 1.1.13 inclut les modifications suivantes :
-
Support pour l'SAMLauthentification par navigateur. Le pilote inclut un SAML plugin de navigateur qui peut être configuré pour fonctionner avec n'importe quel fournisseur SAML 2.0. Pour un exemple d'utilisation du SAML plug-in de navigateur avec le ODBC pilote, voirConfigurer l'authentification unique à l'aide de ODBC la SAML version 2.0 et du fournisseur d'identité Okta.
-
Vous pouvez désormais configurer la durée de session du rôle lorsque vous utilisez ADFS Azure AD ou le navigateur Azure AD pour l'authentification.
Pour plus d'informations sur ces changements et d'autres, et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, veuillez consulter Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
Fonctionnalités et améliorations
Athena annonce les fonctions et améliorations suivantes.
-
Une nouvelle règle d'optimisation a été introduite pour éviter les analyses de tables en double dans certains cas.
4 octobre 2021
Date de publication : 04/10/2021
Athena annonce les fonctions et améliorations suivantes.
-
SQLOFFSET— La SQL
OFFSET
clause est désormais soutenue dans lesSELECT
déclarations. Pour de plus amples informations, veuillez consulter SELECT. -
CloudWatch métriques d'utilisation — Athena publie désormais la
ActiveQueryCount
métrique dans l'espace deAWS/Usage
noms. Pour de plus amples informations, veuillez consulter Surveillez les statistiques d'utilisation d'Athena avec CloudWatch. -
Planification des requêtes : correction d'un bug qui pouvait, dans de rares cas, entraîner des délais d'expiration de la planification des requêtes.
16 septembre 2021
Date de publication : 16/09/2021
Athena annonce les nouvelles fonctions et améliorations suivantes.
Fonctionnalités
-
Ajout de la prise en charge de la spécification du fichier texte et JSON de la compression à CTAS l'aide de la propriété
write_compression
table. Vous pouvez également spécifier lawrite_compression
propriété CTAS pour le parquet et les ORC formats. Pour de plus amples informations, veuillez consulter CTASpropriétés du tableau. -
Le format BZIP2 de compression est désormais pris en charge pour l'écriture de fichiers texte et de JSON fichiers. Pour plus d'informations sur les formats de compression dans Athena, veuillez consulter Utiliser la compression dans Athena.
Améliorations
-
Correction d'un bogue en raison duquel les informations d'identité n'étaient pas envoyées à la fonction UDF Lambda.
-
Correction d'un problème de poussée des prédicats avec des conditions de filtre disjointes.
-
Correction d'un problème de hachage pour les types décimaux.
-
Correction d'un problème de collecte inutile de statistiques.
-
Suppression d'un message d'erreur incohérent.
-
Amélioration des performances de la jointure par diffusion en appliquant un élagage dynamique des partitions dans le composant master.
-
Pour les requêtes fédérées :
-
Modification de la configuration pour réduire l'occurrence des erreurs
CONSTRAINT_VIOLATION
dans les requêtes fédérées.
-
15 septembre 2021
Date de publication : 15/09/2021
Vous pouvez désormais utiliser une console Amazon Athena repensée (version préliminaire). Un nouveau JDBC pilote Athena a été publié.
Version préliminaire de la console Athena
Vous pouvez désormais utiliser une console Amazon
Pour passer à la nouvelle console
Commencez dès aujourd'hui avec la nouvelle console
Pilote Athena 2.0.24 JDBC
Athena annonce la disponibilité de la version 2.0.24 du JDBC pilote pour Athena. Cette version met à jour la prise en charge du proxy pour tous les fournisseurs d'informations Le pilote prend désormais en charge l'authentification par proxy pour tous les hôtes qui ne sont pas pris en charge par la propriété de connexion NonProxyHosts
.
Pour des raisons pratiques, cette version inclut le téléchargement du JDBC pilote avec et sans le AWS SDK. Cette version JDBC du pilote vous permet d'intégrer à la fois le pilote AWS- SDK et le JDBC pilote Athena dans le projet.
Pour plus d'informations et pour télécharger le nouveau pilote, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec JDBC.
31 août 2021
Date de publication : 31/08/2021
Athena annonce les améliorations de fonctions et les corrections de bogues suivantes.
-
Améliorations apportées à la fédération Athena — Athena a ajouté la prise en charge des types de cartes et une meilleure prise en charge des types complexes dans le cadre de l'Athena Query Federation. SDK
Cette version comprend également des améliorations de la mémoire et des optimisations des performances. -
Nouvelles catégories d'erreurs : introduction des catégories d'erreur
USER
etSYSTEM
dans les messages d'erreur. Ces catégories vous aident à distinguer les erreurs que vous pouvez corriger vous-même (USER
) et les erreurs qui peuvent nécessiter l'assistance du support Athena (SYSTEM
). -
Messagerie d'erreur de requête fédérée : mise à jour des catégorisations
USER_ERROR
pour les erreurs liées aux requêtes fédérées. -
JOIN— Correction de bogues et de problèmes de mémoire spill-to-disk connexes afin d'améliorer les performances et de réduire les erreurs de mémoire lors
JOIN
des opérations.
12 août 2021
Date de publication : 12/08/2021
A publié le pilote ODBC 1.1.12 pour Athena. Cette version corrige les problèmes liés à SQLPrepare()
, SQLGetInfo()
et EndpointOverride
.
Pour télécharger le nouveau pilote, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec ODBC.
6 août 2021
Date de publication : 06/08/2021
Amazon Athena annonce la disponibilité d'Athena et ses fonctions
Cette version étend la disponibilité d'Athena dans la région Asie-Pacifique pour inclure Asie-Pacifique (Hong Kong), Asie-Pacifique (Mumbai), Asie-Pacifique (Osaka), Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney) et Asie-Pacifique (Sydney) et Asie-Pacifique (Tokyo). Pour une liste complète des services Services AWS disponibles dans ces régions et dans d'autres, consultez la liste Région AWS complète des services
5 août 2021
Date de publication : 05/08/2021
Vous pouvez utiliser l'UNLOAD
instruction pour écrire le résultat d'une SELECT
requête aux JSON formats PARQUET ORCAVRO,, et.
Pour de plus amples informations, veuillez consulter UNLOAD.
30 juillet 2021
Date de publication : 30/07/2021
Athena annonce les améliorations de fonctions et les corrections de bogues suivantes.
-
Filtrage dynamique et élagage des partitions : ces améliorations permettent d'augmenter les performances et de réduire la quantité de données analysées dans certaines requêtes, comme dans l'exemple suivant.
Cet exemple suppose que
Table_B
est une table non partitionnée dont la taille des fichiers est inférieure à 20 Mo. Pour les requêtes de ce type, moins de données sont lues à partir de laTable_A
et la requête se termine plus rapidement.SELECT * FROM Table_A JOIN Table_B ON Table_A.date = Table_B.date WHERE Table_B.column_A = "value"
-
ORDERBY withLIMIT, DISTINCT with LIMIT — Améliorations des performances des requêtes qui utilisent
ORDER BY
ou sontDISTINCT
suivies d'uneLIMIT
clause. -
Fichiers S3 Glacier Deep Archive : lorsqu'Athena interroge une table contenant à la fois des fichiers S3 Glacier Deep Archive et des fichiers non S3 Glacier, Athena ignore désormais les fichiers S3 Glacier Deep Archive. Auparavant, vous deviez déplacer manuellement ces fichiers depuis l'emplacement de la requête, faute de quoi la requête échouait. Si vous souhaitez utiliser Athena pour interroger des objets dans la mémoire me stockage S3 Glacier Deep Archive, vous devez les restaurer. Pour plus d'informations, consultez la rubrique Restauration d'un objet archivé du Guide de l'utilisateur de Simple Storage Service (Amazon S3).
-
Correction d'un bogue en raison duquel les fichiers vides créés par la propriété CTAS bucketed_by table n'étaient pas correctement chiffrés.
21 juillet 2021
Date de publication : 21/07/2021
Avec la version de juillet 2021 de Microsoft Power BI Desktop
Comme le connecteur utilise le nom de votre source de ODBC données existante (DSN) pour se connecter à Athena et exécuter des requêtes sur Athena, il nécessite le pilote Athena. ODBC Pour télécharger le ODBC pilote le plus récent, consultezConnectez-vous à Amazon Athena avec ODBC.
Pour de plus amples informations, veuillez consulter Utiliser le connecteur Amazon Athena Power BI.
16 juillet 2021
Date de publication : 16/07/2021
Amazon Athena a mis à jour son intégration à Apache Hudi. Hudi est un cadre de gestion de données open source utilisé pour simplifier le traitement progressif des données dans les lacs de données Simple Storage Service (Amazon S3). L'intégration mise à jour vous permet d'utiliser Athena pour interroger les tables Hudi 0.8.0 gérées via AmazonEMR, Apache Spark, Apache Hive ou d'autres services compatibles. En outre, Athena prend désormais en charge deux fonctionnalités supplémentaires : les requêtes instantanées sur les tables ( Merge-on-ReadMoR) et la prise en charge de la lecture sur les tables bootstrap.
Apache Hudi fournit un traitement des données de niveau record qui peut vous aider à simplifier le développement des pipelines Change Data Capture (CDC), à vous conformer aux mises à jour et aux suppressions GDPR basées sur les données et à mieux gérer les données en streaming provenant de capteurs ou d'appareils nécessitant une insertion de données et des mises à jour d'événements. La version 0.8.0 facilite la migration des grandes tables Parquet vers Hudi sans copier les données afin de pouvoir les interroger et les analyser via Athena. Vous pouvez utiliser la nouvelle prise en charge des requêtes d'instantané d'Athena pour obtenir des vues en temps quasi réel des mises à jour de vos tables diffusées en streaming.
Pour en savoir plus sur l'utilisation de Hudi avec Athena, voir Interrogez les ensembles de données Apache Hudi.
8 juillet 2021
Date de publication : 08/07/2021
A publié le pilote ODBC 1.1.11 pour Athena. Le ODBC pilote peut désormais authentifier la connexion à l'aide d'un jeton JSON Web (JWT). Sous Linux, la valeur par défaut de la propriété Groupe de travail a été définie sur Primaire.
Pour plus d'informations et pour télécharger le nouveau pilote, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec ODBC.
1er juillet 2021
Date de publication : 01/07/2021
Le 1er juillet 2021, le traitement spécial des groupes de travail de prévisualisation a pris fin. Bien que les groupes de travail AmazonAthenaPreviewFunctionality
retiennent leur nom, ils n'ont plus de statut spécial. Vous pouvez continuer à utiliser les groupes de travail AmazonAthenaPreviewFunctionality
pour visualiser, modifier, organiser et exécuter des requêtes. Toutefois, les requêtes qui utilisent des fonctions qui étaient auparavant en prévisualisation sont désormais soumises aux conditions de facturation standard d'Athena. Pour plus d'informations sur la facturation, consultez la rubrique Tarification Amazon Athena
23 Juin 2021
Date de publication : 23/06/2021
Sortie des JDBC pilotes 2.0.23 et ODBC 1.1.10 pour Athena. Les deux pilotes offrent des performances de lecture améliorées, des EXPLAINinstructions de support et des requêtes paramétrées.
EXPLAIN
les instructions indiquent le plan d'exécution logique ou distribué d'une SQL requête. Les requêtes paramétrées permettent d'utiliser la même requête plusieurs fois avec des valeurs différentes fournies au moment de l'exécution.
La JDBC version ajoute également la prise en charge d'Active Directory Federation Services 2019 et une option personnalisée de remplacement des points de terminaison pour AWS STS. Cette ODBC version corrige un problème lié aux informations d'identification du IAM profil.
Pour plus d'informations et pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
12 mai 2021
Date de publication : 12/05/2021
Vous pouvez désormais utiliser Amazon Athena pour enregistrer un AWS Glue catalogue à partir d'un compte autre que le vôtre. Après avoir configuré les IAM autorisations requises pour AWS Glue, vous pouvez utiliser Athena pour exécuter des requêtes entre comptes.
Pour plus d’informations, consultez Enregistrer un catalogue de données à partir d'un autre compte et Configurer l'accès entre comptes à AWS Glue catalogues de données.
10 mai 2021
Date de publication : 10/05/2021
Sortie de la version 1.1.9.1001 du ODBC pilote pour Athena. Cette version corrige un problème avec le type d'authentification BrowserAzureAD
lors de l'utilisation d'Azure Active Directory (AD).
Pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec ODBC.
5 mai 2021
Date de publication : 05/05/2021
Vous pouvez désormais utiliser le connecteur Vertica d'Amazon Athena dans les requêtes fédérées pour interroger les sources de données Vertica depuis Athena. Par exemple, vous pouvez exécuter des requêtes analytiques sur un entrepôt de données sur Vertica et un lac de données sur Simple Storage Service (Amazon S3).
Pour déployer le connecteur Athena Vertica, rendez-vous AthenaVerticaConnector
Le connecteur Vertica d'Amazon Athena expose plusieurs options de configuration par le biais de variables d'environnement Lambda. Pour plus d'informations sur les options de configuration, les paramètres, les chaînes de connexion, le déploiement et les limitations, voir Connecteur Amazon Athena pour Vertica.
Pour obtenir des informations détaillées sur l'utilisation du connecteur Vertica, consultez la section Interrogation d'une source de données Vertica dans Amazon Athena à l'aide de la requête fédérée SDK Athena
30 avril 2021
Date de publication : 30/04/2021
Sortie des pilotes JDBC 2.0.21 et ODBC 1.1.9 pour Athena. Les deux versions prennent en charge SAML l'authentification avec Azure Active Directory (AD) et SAML l'authentification avec PingFederate. La JDBC version prend également en charge les requêtes paramétrées. Pour plus d'informations sur les requêtes paramétrées dans Athena, voir Utiliser des requêtes paramétrées.
Pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
29 avril 2021
Date de publication : 29/04/2021
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena dans les régions Chine (Beijing) et Chine (Ningxia).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
26 avril 2021
Date de publication : 26/04/2021
Les fonctions de valeur de fenêtre dans la version 2 du moteur Athena prennent désormais en charge IGNORE NULLS
et RESPECT NULLS
.
Pour plus d'informations, consultez la rubrique Fonctions de valeur
21 avril 2021
Date de publication : 21/04/2021
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena dans les régions Europe (Milan) et Afrique (Le Cap).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
5 avril 2021
Date de publication : 05/04/2021
EXPLAINDéclaration
Vous pouvez désormais utiliser l'EXPLAIN
instruction dans Athena pour afficher le plan d'exécution de vos SQL requêtes.
Pour plus d’informations, consultez Utiliser EXPLAIN et EXPLAIN ANALYZE dans Athéna et Comprendre les résultats de la déclaration d'Athéna EXPLAIN.
SageMaker Modèles de Machine Learning dans les SQL requêtes
L'inférence de modèles d'apprentissage automatique avec Amazon SageMaker est désormais généralement disponible pour Amazon Athena. Utilisez des modèles d'apprentissage automatique dans les SQL requêtes pour simplifier les tâches complexes telles que la détection des anomalies, l'analyse des cohortes de clients et les prévisions de séries chronologiques en invoquant une fonction dans une requête. SQL
Pour de plus amples informations, veuillez consulter Utiliser le Machine Learning (ML) avec Amazon Athena.
Fonctions définies par l'utilisateur (UDF)
Les fonctions définies par l'utilisateur (UDFs) sont désormais généralement disponibles pour Athena. UDFsUtilisez-le pour tirer parti des fonctions personnalisées qui traitent des enregistrements ou des groupes d'enregistrements en une seule SQL requête.
Pour de plus amples informations, veuillez consulter Requête avec fonctions définies par l'utilisateur.
30 mars 2021
Date de publication : 30/03/2021
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena dans les régions Asie-Pacifique (Hong Kong) et Moyen-Orient (Bahreïn).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
25 mars 2021
Date de publication : 25/03/2021
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena dans la région Europe (Stockholm).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
5 mars 2021
Date de publication : 05/03/2021
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena dans les régions Canada (Centre), Europe (Francfort) et Amérique du Sud (Sao Paulo).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
25 février 2021
Date de publication : 25/02/2021
Amazon Athena annonce la disponibilité générale de la version 2 du moteur Athena dans les régions Asie-Pacifique (Séoul), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Europe (Londres) et Europe (Paris).
Pour plus d'informations sur la version 2 du moteur Athena, voir Version 2 du moteur Athena.
Notes de publication d'Athena pour 2020
16 décembre 2020
Date de publication : 16/12/2020
Amazon Athena annonce la disponibilité de la version 2 du moteur Athena, Athena Federated Query, et dans d'autres régions. AWS PrivateLink
Version 2 du moteur Athena et requête fédérée d’Athena
Amazon Athena annonce la disponibilité générale de la version 2 du moteur Athena et de la requête fédérée d’Athena dans les régions Asie-Pacifique (Mumbai), Asie-Pacifique (Tokyo), Europe (Irlande) et USA Ouest (Californie du Nord). La version 2 du moteur Athena et les requêtes fédérées sont déjà disponibles dans les régions USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon).
Pour plus d’informations, consultez Version 2 du moteur Athena et Utiliser la requête fédérée Amazon Athena.
AWS PrivateLink
AWS PrivateLink for Athena est désormais pris en charge dans la région Europe (Stockholm). Pour plus d'informations sur AWS PrivateLink Athéna, voir. Connectez-vous à Amazon Athena à l'aide d'un point de terminaison d'interface VPC
24 novembre 2020
Date de publication : 24/11/2020
Sortie des pilotes JDBC 2.0.16 et ODBC 1.1.6 pour Athena. Ces versions prennent en charge, au niveau du compte, l'authentification multifactorielle Okta Verify ()MFA. Vous pouvez également utiliser Okta MFA pour configurer l'SMSauthentification et l'authentification Google Authenticator en tant que facteurs.
Pour télécharger les nouveaux pilotes, les notes de mise à jour et la documentation, voir Connectez-vous à Amazon Athena avec JDBC et Connectez-vous à Amazon Athena avec ODBC.
11 novembre 2020
Date de publication : 11/11/2020
Amazon Athena annonce la disponibilité générale de la version 2 du moteur Athena et des requêtes fédérées dans les régions USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon).
Version 2 du moteur Athena
Amazon Athena annonce la disponibilité générale d'une nouvelle version du moteur de requête, la version 2 du moteur Athena, dans les régions USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon).
La version 2 du moteur Athena inclut des améliorations des performances et de nouvelles fonctionnalités telles que la prise en charge de l'évolution des schémas pour les données au format Parquet, des fonctions géospatiales supplémentaires, la prise en charge de la lecture de schémas imbriqués pour réduire les coûts, et des améliorations des performances et des opérations. JOIN AGGREGATE
-
Pour plus d'informations sur les améliorations, les évolutions et les corrections de bogues, voir Version 2 du moteur Athena.
-
Pour plus d'informations sur la procédure de mise à niveau, voir Modifier les versions du moteur Athena.
-
Pour plus d'informations sur le test des requêtes, voir Tester les requêtes avant la mise à niveau de la version du moteur.
Requêtes fédérées SQL
Vous pouvez désormais utiliser la requête fédérée d'Athena dans les régions USA Est (Virginie du Nord), USA Est (Ohio) et USA Ouest (Oregon) sans utiliser le groupe de travail AmazonAthenaPreviewFunctionality
.
Utilisez les SQL requêtes fédérées pour exécuter des SQL requêtes sur des sources de données relationnelles, non relationnelles, d'objets et personnalisées. Avec les requêtes fédérées, vous pouvez soumettre une seule SQL requête qui analyse les données provenant de plusieurs sources exécutées sur site ou hébergées dans le cloud.
L'exécution d'analyses sur les données réparties entre les applications peut être complexe et chronophage pour les raisons suivantes :
-
Les données nécessaires aux analyses sont souvent réparties dans des magasins de données relationnels, valeurs clés, de documents, en mémoire, de recherche, de graphiques, d'objets, de séries chronologiques et de grand livre.
-
Pour analyser les données provenant de ces sources, les analystes construisent des pipelines complexes pour extraire, transformer et charger un entrepôt de données afin que les données puissent être interrogées.
-
L'accès aux données provenant de différentes sources nécessite l'apprentissage de nouveaux langages de programmation et de nouveaux concepts d'accès aux données.
SQLLes requêtes fédérées d'Athena éliminent cette complexité en permettant aux utilisateurs d'interroger les données sur place, où qu'elles se trouvent. Les analystes peuvent utiliser SQL des structures familières pour les JOIN
données provenant de plusieurs sources de données pour une analyse rapide, et stocker les résultats dans Amazon S3 pour une utilisation ultérieure.
Connecteurs de source de données
Pour traiter les requêtes fédérées, Athena utilise les connecteurs de sources de données Athena qui s'exécutent sur AWS Lambda
Connecteurs de source de données personnalisés
Grâce à Athena Query Federation SDK
Étapes suivantes
-
Pour en savoir plus sur la fonction de requête fédérée, voir Utiliser la requête fédérée Amazon Athena.
-
Pour commencer à utiliser un connecteur existant, reportez-vous à la section Déploiement d'un connecteur et connexion à une source de données.
-
Pour savoir comment créer votre propre connecteur de source de données à l'aide de l'Athena Query FederationSDK, voir Exemple de connecteur Athena
sur. GitHub
22 octobre 2020
Date de publication : 22/10/2020
Tu peux maintenant appeler Athéna avec. AWS Step Functions AWS Step Functions peut contrôler certains Services AWS directement à l'aide de l'Amazon States Language. Vous pouvez utiliser Step Functions avec Athena pour lancer et arrêter l'exécution de requêtes, obtenir des résultats de requêtes, exécuter des requêtes de données ad hoc ou planifiées et récupérer les résultats des lacs de données dans Amazon S3.
Pour plus d'informations, consultez la rubrique Appel d'Athena avec Step Functions du Guide du développeur AWS Step Functions .
29 juillet 2020
Date de publication : 29/07/2020
A publié la version 2.0.13 du JDBC pilote. Cette version prend en charge l'utilisation de plusieurs catalogues de données enregistrés auprès d'Athena, le service Okta pour l'authentification et les connexions aux points de terminaison. VPC
Pour télécharger et utiliser la nouvelle version du pilote, voir Connectez-vous à Amazon Athena avec JDBC.
9 juillet 2020
Date de publication : 09/07/2020
Amazon Athena prend en charge l'interrogation des ensembles de données Hudi compactés et ajoute la AWS CloudFormation
AWS::Athena::DataCatalog
ressource permettant de créer, de mettre à jour ou de supprimer les catalogues de données que vous enregistrez dans Athena.
Jeux de données Apache Hudi
Apache Hudi est un cadre de gestion de données open source qui simplifie le traitement progressif des données. Amazon Athena prend désormais en charge l'interrogation de la vue optimisée en lecture d'un jeu de données Apache Hudi dans votre lac de données basé sur Simple Storage Service (Amazon S3).
Pour de plus amples informations, veuillez consulter Interrogez les ensembles de données Apache Hudi.
AWS CloudFormation Ressource de catalogue de données
Pour utiliser la fonction de requête fédérée d'Amazon Athena afin d'interroger n'importe quelle source de données, vous devez d'abord enregistrer votre catalogue de données dans Athena. Vous pouvez désormais utiliser cette AWS CloudFormation AWS::Athena::DataCatalog
ressource pour créer, mettre à jour ou supprimer les catalogues de données que vous enregistrez dans Athena.
Pour plus d'informations, consultez AWS: :Athena : : DataCatalog dans le guide de l'AWS CloudFormation utilisateur.
1er juin 2020
Date de publication : 01/06/2020
Utilisation du métastore Apache Hive comme métacatalogue avec Amazon Athena
Vous pouvez désormais connecter Athena à un ou plusieurs métastores Apache Hive en plus du AWS Glue Data Catalog avec Athena.
Pour vous connecter à un métastore Hive auto-hébergé, vous avez besoin d'un connecteur de métastore Hive Athena. Athena fournit un connecteur de mise en œuvre de référence que vous pouvez utiliser. Le connecteur s'exécute en tant que fonction AWS Lambda dans votre compte.
Pour de plus amples informations, veuillez consulter Utiliser un métastore Hive externe.
21 mai 2020
Date de publication : 21/05/2020
Amazon Athena ajoute la prise en charge de la projection de partition. Utilisez la projection de partition pour accélérer le traitement des requêtes de tables hautement partitionnées et automatiser la gestion des partitions. Pour de plus amples informations, veuillez consulter Utiliser la projection de partitions avec Amazon Athena.
1er avril 2020
Date de publication : 01/04/2020
Outre la région USA Est (Virginie du Nord), les fonctionnalités de requête fédérée Amazon Athena, de fonctions définies par l'utilisateur (UDFs), d'inférence d'apprentissage automatique et de métastore Hive externes sont désormais disponibles en version préliminaire dans les régions Asie-Pacifique (Mumbai), Europe (Irlande) et USA Ouest (Oregon).
11 mars 2020
Date de publication : 11/03/2020
Amazon Athena publie désormais des EventBridge événements Amazon pour les transitions d'état des requêtes. Lorsqu'une requête passe d'un état à un autre (par exemple, de l'état En cours à un état terminal tel que Réussi ou Annulé), Athena publie un événement de changement d'état de requête sur. EventBridge Cet événement contient des informations sur le changement de l'état de la requête. Pour de plus amples informations, veuillez consulter Surveillez les événements de requête Athena avec EventBridge.
6 mars 2020
Date de publication : 06/03/2020
Vous pouvez désormais créer et mettre à jour des groupes de travail Amazon Athena à l'aide de cette ressource. AWS CloudFormation
AWS::Athena::WorkGroup
Pour plus d'informations, consultez AWS: :Athena : : WorkGroup dans le guide de l'AWS CloudFormation utilisateur.
Notes de publication d'Athena pour 2019
26 novembre 2019
Date de publication : 17/12/2019
Amazon Athena permet d'exécuter des SQL requêtes sur des sources de données relationnelles, non relationnelles, d'objets et personnalisées, d'invoquer des modèles d'apprentissage automatique dans les SQL requêtes, des fonctions définies par l'utilisateur (UDFs) (version préliminaire), d'utiliser Apache Hive Metastore comme catalogue de métadonnées avec Amazon Athena (version préliminaire) et de quatre mesures supplémentaires liées aux requêtes.
Requêtes fédérées SQL
Utilisez les SQL requêtes fédérées pour exécuter des SQL requêtes sur des sources de données relationnelles, non relationnelles, d'objets et personnalisées.
Vous pouvez désormais utiliser la requête fédérée d'Athena pour analyser les données stockées dans des sources de données relationnelles, non relationnelles, objet et personnalisées. Avec les requêtes fédérées, vous pouvez soumettre une seule SQL requête qui analyse les données provenant de plusieurs sources exécutées sur site ou hébergées dans le cloud.
L'exécution d'analyses sur les données réparties entre les applications peut être complexe et chronophage pour les raisons suivantes :
-
Les données nécessaires aux analyses sont souvent réparties dans des magasins de données relationnels, valeurs clés, de documents, en mémoire, de recherche, de graphiques, d'objets, de séries chronologiques et de grand livre.
-
Pour analyser les données provenant de ces sources, les analystes construisent des pipelines complexes pour extraire, transformer et charger un entrepôt de données afin que les données puissent être interrogées.
-
L'accès aux données provenant de différentes sources nécessite l'apprentissage de nouveaux langages de programmation et de nouveaux concepts d'accès aux données.
SQLLes requêtes fédérées d'Athena éliminent cette complexité en permettant aux utilisateurs d'interroger les données sur place, où qu'elles se trouvent. Les analystes peuvent utiliser SQL des structures familières pour les JOIN
données provenant de plusieurs sources de données pour une analyse rapide, et stocker les résultats dans Amazon S3 pour une utilisation ultérieure.
Connecteurs de source de données
Athena traite les requêtes fédérées à l'aide des connecteurs de sources de données Athena qui s'exécutent sur AWS Lambda
Connecteurs de source de données personnalisés
Grâce à Athena Query Federation SDK
Disponibilité de l'aperçu
La requête fédérée d’Athena est disponible en prévisualisation dans la région USA Est (Virginie du Nord).
Étapes suivantes
-
Pour commencer votre aperçu, suivez les instructions des fonctionnalités d'Athena Preview
. FAQ -
Pour en savoir plus sur la fonction de requête fédérée, consultez la rubrique Utilisation de la requête fédérée d’Amazon Athena (prévisualisation).
-
Pour commencer à utiliser un connecteur existant, reportez-vous à la section Déploiement d'un connecteur et connexion à une source de données.
-
Pour savoir comment créer votre propre connecteur de source de données à l'aide de l'Athena Query FederationSDK, voir Exemple de connecteur Athena
sur. GitHub
Invoquer des modèles de Machine Learning dans les requêtes SQL
Vous pouvez désormais invoquer des modèles de machine learning pour l'inférence directement à partir de vos requêtes Athena. La possibilité d'utiliser des modèles d'apprentissage automatique dans les SQL requêtes rend les tâches complexes telles que la détection des anomalies, l'analyse des cohortes de clients et les prévisions de ventes aussi simples que l'invocation d'une fonction dans une requête. SQL
Modèles ML
Vous pouvez utiliser plus d'une douzaine d'algorithmes d'apprentissage automatique intégrés fournis par Amazon SageMaker
Disponibilité de l'aperçu
La fonctionnalité ML d'Athena est disponible aujourd'hui en prévisualisation dans la région USA Est (Virginie du Nord).
Étapes suivantes
-
Pour commencer votre aperçu, suivez les instructions des fonctionnalités d'Athena Preview
. FAQ -
Pour en savoir plus sur la fonction de machine learning, consultez la rubrique Utilisation de machine learning (ML) avec Amazon Athena (version de prévisualisation).
Fonctions définies par l'utilisateur (UDFs) (Aperçu)
Vous pouvez désormais écrire des fonctions scalaires personnalisées et les invoquer dans vos requêtes Athena. Vous pouvez écrire votre texte UDFs en Java à l'aide de l'Athena Query FederationFILTER
clauses SELECT
et d'une SQL requête. Vous pouvez en invoquer plusieurs UDFs dans la même requête.
Disponibilité de l'aperçu
La UDF fonctionnalité Athena est disponible en mode aperçu dans la région USA Est (Virginie du Nord).
Étapes suivantes
-
Pour commencer votre aperçu, suivez les instructions des fonctionnalités d'Athena Preview
. FAQ -
Pour en savoir plus, consultez Interrogation avec des fonctions définies par l'utilisateur (version de prévisualisation).
-
Pour des exemples d'UDFimplémentations, consultez Amazon UDF Athena
Connector sur. GitHub -
Pour savoir comment écrire vos propres fonctions à l'aide de l'Athena Query FederationSDK, consultez Création et déploiement d'une fonction utilisant UDF Lambda.
Utilisation du métastore Apache Hive comme métacatalogue avec Amazon Athena (version de prévisualisation)
Vous pouvez désormais connecter Athena à un ou plusieurs métastores Apache Hive en plus du AWS Glue Data Catalog avec Athena.
Connecteur Metastore
Pour vous connecter à un métastore Hive auto-hébergé, vous avez besoin d'un connecteur de métastore Hive Athena. Athena fournit un connecteur de mise en œuvre de référence
Disponibilité de l'aperçu
La fonction de métastore Hive est disponible en mode Prévisualisation dans la région USA Est (Virginie du Nord).
Étapes suivantes
-
Pour commencer votre aperçu, suivez les instructions des fonctionnalités d'Athena Preview
. FAQ -
Pour en savoir plus sur cette fonction, veuillez consulter notre article intitulé Utilisation du connecteur de données Athena pour le métastore Hive externe (version de prévisualisation).
Nouvelles mesures liées à la requête
Athena publie désormais des métriques de requête supplémentaires qui peuvent vous aider à comprendre les performances d'Amazon Athena
-
Durée de planification de requêtes : temps nécessaire à la planification de la requête. Cela inclut le temps passé à récupérer les partitions de la table à partir de la source de données,
-
Durée de mise en file d'attente des requêtes : temps pendant lequel la requête est restée dans une file d'attente de ressources.
-
Durée de traitement du service : temps nécessaire à l'écriture des résultats après la fin du traitement du moteur de requête.
-
Durée totale d'exécution : temps nécessaire pour qu'Athena exécute la requête.
Pour utiliser ces nouvelles métriques de requête, vous pouvez créer des tableaux de bord personnalisés, définir des alarmes et des déclencheurs sur les métriques ou utiliser des tableaux de bord préremplis directement depuis la console Athena. CloudWatch
Étapes suivantes
Pour plus d'informations, consultez la section Surveillance des requêtes Athena à l'aide CloudWatch de métriques.
12 novembre 2019
Date de publication : 17/12/2019
Amazon Athena est désormais disponible dans la région Moyen-Orient (Bahreïn).
8 novembre 2019
Date de publication : 17/12/2019
Amazon Athena est désormais disponible dans les régions USA Ouest (Californie du Nord) et Europe (Paris).
8 octobre 2019
Date de publication : 17/12/2019
Amazon Athena
Pour créer un point de VPC terminaison d'interface pour vous connecter à Athena, vous pouvez utiliser le AWS Management Console ou AWS Command Line Interface ()AWS CLI. Pour plus d'informations sur la création d'un point de terminaison d'interface, voir Création d'un point de terminaison d'interface.
Lorsque vous utilisez un point de VPC terminaison d'interface, la communication entre vous VPC et Athena APIs est sécurisée et reste au sein du AWS réseau. Cette fonction est disponible sans frais supplémentaires pour Athena. Des frais relatifs aux VPC terminaux d'
Pour en savoir plus sur cette fonctionnalité, consultez Se connecter à Amazon Athena à l'aide d'un point de terminaison d'interface VPC.
19 septembre 2019
Date de publication : 17/12/2019
Amazon Athena ajoute la prise en charge de l'insertion de nouvelles données dans une table existante à l'aide de l'instruction INSERT INTO
. Vous pouvez insérer de nouvelles lignes dans un tableau de destination basé sur une instruction de requête SELECT
qui s'exécute sur un tableau source, ou basé sur un ensemble de valeurs fourni dans le cadre d'une instruction de requête. Les formats de données pris en charge incluent AvroJSON,ORC,, Parquet et les fichiers texte.
INSERT INTO
les relevés peuvent également vous aider à simplifier votre ETL processus. Par exemple, vous pouvez utiliser INSERT INTO
une seule requête pour sélectionner les données d'une table source JSON formatée et les écrire dans une table de destination au format Parquet.
Les instructions INSERT INTO
sont facturées en fonction du nombre d'octets analysés dans la phase SELECT
, de la même manière qu'Athena le fait pour les requêtes SELECT
. Pour plus d'informations, consultez la rubrique Tarification Amazon Athena
Pour plus d'informations sur l'utilisationINSERT INTO
, y compris les formats pris en charge, SerDes ainsi que des exemples, consultez le INSERTINTOguide de l'utilisateur d'Athena.
12 septembre 2019
Date de publication : 17/12/2019
Amazon Athena est désormais disponible dans la région Asie-Pacifique (Hong Kong).
16 août 2019
Date de publication : 17/12/2019
Amazon Athena
Lorsqu'un compartiment Simple Storage Service (Amazon S3) est configuré en tant que Paiement par le demandeur, c'est le demandeur, et non le propriétaire du compartiment, qui paie la requête Simple Storage Service (Amazon S3) et les coûts de transfert des données. Dans Athena, les administrateurs de groupes de travail peuvent désormais configurer les paramètres des groupes de travail pour permettre aux membres de ces derniers d'interroger les compartiments S3 de type Paiement par le demandeur.
Pour plus d'informations sur la configuration du paramètre Paiement par le demandeur pour votre groupe de travail, reportez-vous à la section Création d'un groupe de travail du Guide de l'utilisateur d'Amazon Athena. Pour plus d'informations sur les compartiments de type Paiement par le demandeur, consultez la rubrique Compartiments de type Paiement par le demandeur du Guide du développeur Amazon Simple Storage Service.
9 août 2019
Date de publication : 17/12/2019
Amazon Athena prend désormais en charge l'application de politiques AWS Lake Formation
Vous pouvez utiliser cette fonctionnalité dans les pays suivants Régions AWS : USA Est (Ohio), USA Est (Virginie du Nord), USA Ouest (Oregon), Asie-Pacifique (Tokyo) et Europe (Irlande). Cette fonctionnalité est disponible sans frais additionnels.
Pour plus d'informations sur l'utilisation de cette fonction, consultez Utilisez Athena pour interroger les données enregistrées auprès de AWS Lake Formation. Pour plus d'informations sur AWS Lake Formation, consultez AWS Lake Formation
26 juin 2019
Amazon Athena est désormais disponible dans la région Europe (Stockholm). Pour obtenir la liste des régions prises en charge, consultez Régions AWS et Points de terminaison.
24 mai 2019
Date de publication : 24/05/2019
Amazon Athena est désormais disponible dans les régions AWS GovCloud (USA Est) et AWS GovCloud (USA Ouest). Pour obtenir la liste des régions prises en charge, consultez Régions AWS et Points de terminaison.
5 mars 2019
Date de publication : 05/03/2019
Amazon Athena est désormais disponible dans la région Canada (Centre). Pour obtenir la liste des régions prises en charge, consultez Régions AWS et Points de terminaison. Sortie de la nouvelle version du ODBC pilote prenant en charge les groupes de travail Athena. Pour plus d'informations, consultez les notes de mise à jour du ODBC pilote
Pour télécharger la version 1.0.5 du ODBC pilote et sa documentation, consultezConnectez-vous à Amazon Athena avec ODBC. Pour plus d'informations sur cette version, consultez les notes de mise à jour du ODBC pilote
Pour utiliser des groupes de travail avec le ODBC pilote, définissez la nouvelle propriété de connexion dans la chaîne de connexionWorkgroup
, comme indiqué dans l'exemple suivant :
Driver=Simba Athena ODBC Driver;AwsRegion=[Region];S3OutputLocation=[S3Path];AuthenticationType=IAM Credentials;UID=[YourAccessKey];PWD=[YourSecretKey];Workgroup=[WorkgroupName]
Pour plus d'informations, recherchez « groupe de travail » dans le Guide d'installation et de configuration des ODBC pilotes version 1.0.5
Cette version du pilote vous permet d'utiliser les actions de API groupe de travail Athena pour créer et gérer des groupes de travail, et les actions de balises Athena pour ajouter, répertorier ou supprimer des API balises dans les groupes de travail. Avant de commencer, assurez-vous que vous disposez d'autorisations au niveau des ressources IAM pour effectuer des actions sur les groupes de travail et les balises.
Pour plus d’informations, consultez :
Si vous utilisez le JDBC pilote ou le AWS SDK, passez à la dernière version du piloteSDK, qui inclut déjà la prise en charge des groupes de travail et des balises dans Athena. Pour de plus amples informations, veuillez consulter Connectez-vous à Amazon Athena avec JDBC.
22 février 2019
Date de publication : 22/02/2019
Ajout de la prise en charge des étiquettes pour les groupes de travail dans Amazon Athena. une identification est constituée d'une clé et d'une valeur que vous définissez. Lorsque vous identifiez un groupe de travail, vous lui attribuez des métadonnées personnalisées. Vous pouvez ajouter des balises aux groupes de travail pour les classer par catégories, en utilisant les meilleures pratiques en matière de AWS balisage. Vous pouvez utiliser des identifications pour limiter l'accès aux groupes de travail et pour suivre les coûts. Par exemple, créez un groupe de travail pour chaque centre de coûts. Ensuite, en ajoutant des étiquettes à ces groupes de travail, vous pouvez suivre vos dépenses Athena pour chaque centre de coûts. Pour plus d'informations, consultez Utilisation d'identifications pour la facturation dans le guide de l'utilisateur AWS Billing and Cost Management .
Vous pouvez utiliser les balises à l'aide de la console Athena ou des API opérations. Pour de plus amples informations, veuillez consulter Tag : ressources d'Athena.
Dans la console Athena, vous pouvez ajouter une ou plusieurs étiquettes à chacun de vos groupes de travail et effectuer une recherche par étiquette. Les groupes de travail sont une ressource IAM contrôlée dans Athena. DansIAM, vous pouvez restreindre les personnes autorisées à ajouter, supprimer ou répertorier des balises dans les groupes de travail que vous créez. Vous pouvez également utiliser l'CreateWorkGroup
APIopération comportant le paramètre de balise facultatif pour ajouter une ou plusieurs balises au groupe de travail. Pour ajouter, supprimer ou répertorier des identifications, utilisez TagResource
, UntagResource
et ListTagsForResource
. Pour de plus amples informations, veuillez consulter Opérations d'utilisation API et de AWS CLI balisage.
Pour permettre aux utilisateurs d'ajouter des balises lors de la création de groupes de travail, assurez-vous d'autoriser chaque utilisateur IAM à la fois sur les CreateWorkGroup
API actions TagResource
et. Pour plus d’informations et d’exemples, consultez Utiliser des politiques de contrôle d'IAMaccès basées sur des balises.
Aucune modification n'est apportée au JDBC pilote lorsque vous utilisez des balises dans des groupes de travail. Si vous créez de nouveaux groupes de travail et utilisez le JDBC pilote ou le AWS SDK, passez à la dernière version du pilote etSDK. Pour plus d’informations, veuillez consulter Connectez-vous à Amazon Athena avec JDBC.
18 février 2019
Date de publication : 18/02/2019
Ajout de la possibilité de contrôler les coûts de requête en exécutant des requêtes dans des groupes de travail. Pour plus d’informations, veuillez consulter Utilisez des groupes de travail pour contrôler l'accès aux requêtes et les coûts. Amélioration de l'JSONOpenX SerDe utilisé dans Athena, correction d'un problème en raison duquel Athena n'ignorait pas les objets transférés vers la classe de GLACIER
stockage et ajout d'exemples d'interrogation des journaux Network Load Balancer.
Modifications suivantes effectuées :
-
Ajout de la prise en charge des groupes de travail. Utilisation de groupes de travail pour séparer les utilisateurs, les équipes, les applications ou les charges de travail, et pour définir des limites au volume de données pouvant être traité par chaque requête ou groupe de travail entier. Les groupes de travail agissant comme IAM des ressources, vous pouvez utiliser des autorisations au niveau des ressources pour contrôler l'accès à un groupe de travail spécifique. Vous pouvez également consulter les métriques relatives aux requêtes dans Amazon CloudWatch, contrôler les coûts des requêtes en limitant la quantité de données numérisées, créer des seuils et déclencher des actions, telles que des SNS alarmes Amazon, lorsque ces seuils sont dépassés. Pour plus d’informations, consultez Utilisez des groupes de travail pour contrôler l'accès aux requêtes et les coûts et Utiliser CloudWatch et EventBridge surveiller les requêtes et contrôler les coûts.
Les groupes de travail sont une ressource IAM. Pour obtenir la liste complète des actions, ressources et conditions liées aux groupes de travail dans, consultez la section ActionsIAM, ressources et clés de condition pour Amazon Athena dans la référence d'autorisation de service. Avant de créer de nouveaux groupes de travail, assurez-vous d'utiliser les IAMpolitiques de groupe de travail et le. AWS politique gérée : AmazonAthenaFullAccess
Vous pouvez utiliser des groupes de travail dans la console, dans le cadre d'APIopérations de groupe de travail ou avec le JDBC pilote. Pour de plus amples informations sur la création de stratégies pour les groupes de travail , consultez Créer un groupe de travail. Pour télécharger le JDBC pilote avec le support des groupes de travail, voirConnectez-vous à Amazon Athena avec JDBC.
Si vous utilisez des groupes de travail avec le JDBC pilote, vous devez définir le nom du groupe de travail dans la chaîne de connexion à l'aide du paramètre de
Workgroup
configuration, comme dans l'exemple suivant :jdbc:awsathena://AwsRegion=
<AWSREGION>
;UID=<ACCESSKEY>
; PWD=<SECRETKEY>
;S3OutputLocation=s3://amzn-s3-demo-bucket/<athena-output>
-<AWSREGION>
/; Workgroup=<WORKGROUPNAME>
;Il n'y a aucun changement dans la façon dont vous exécutez SQL les instructions ou passez des JDBC API appels au conducteur. Le pilote transmet le nom du groupe de travail à Athena.
Pour obtenir des informations sur les différences introduites avec les groupes de travail, consultez Utiliser le groupe de travail Athena APIs et Résoudre les erreurs des groupes de travail.
-
L'JSONOpenX SerDe utilisé dans Athena a été amélioré. Ces améliorations incluent, sans toutefois s'y limiter :
-
Prise en charge de la propriété
ConvertDotsInJsonKeysToUnderscores
. Lorsqu'il est défini surTRUE
, il permet de SerDe remplacer les points dans les noms clés par des traits de soulignement. Par exemple, si l'JSONensemble de données contient une clé portant le nom"a.b"
, vous pouvez utiliser cette propriété pour définir le nom de colonne qui doit figurer"a_b"
dans Athena. L’argument par défaut estFALSE
. Par défaut, Athena n'autorise pas les points dans les noms de colonnes. -
Prise en charge de la propriété
case.insensitive
. Par défaut, Athena exige que toutes les clés de votre JSON jeu de données soient en minuscules.WITH SERDE PROPERTIES ("case.insensitive"= FALSE;)
vous permet d'utiliser des noms de clé sensibles à la casse dans vos données. L’argument par défaut estTRUE
. Lorsqu'il est défini surTRUE
, il SerDe convertit toutes les colonnes majuscules en minuscules.
Pour de plus amples informations, veuillez consulter OpenX JSON SerDe.
-
-
Correction d'un problème à cause duquel le service Athena renvoyait des messages d'erreur
"access denied"
lorsqu'il traitait des objets Simple Storage Service (Amazon S3) archivés dans Glacier par des politiques de cycle de vie Simple Storage Service (Amazon S3). Suite à la correction de ce problème, Athena ignore les objets passés à la classe de stockageGLACIER
. Athena ne prend pas en charge l'interrogation des données à partir de la classe de stockageGLACIER
.Pour plus d'informations, consultez Considérations relatives à Amazon S3 la section Transitioning to the GLACIER Storage Class (Object Archival) dans le guide de l'utilisateur d'Amazon Simple Storage Service.
-
Ajout d'exemples d'interrogation des journaux d'accès à Network Load Balancer qui reçoivent des informations sur les requêtes Transport Layer Security TLS (). Pour de plus amples informations, veuillez consulter Consultez les journaux du Network Load Balancer.
Notes de publication d'Athena pour 2018
20 novembre 2018
Date de publication : 20/11/2018
Publication des nouvelles versions du ODBC pilote JDBC and prenant en charge l'accès fédéré à API Athena avec AD FS SAML et 2.0 (Security Assertion Markup Language 2.0). Pour plus de détails, consultez les notes de version du JDBC ODBC pilote et les notes
Avec cette version, l'accès fédéré à Athena est pris en charge pour Active Directory Federation Service (AD FS 3.0). L'accès est établi via les versions JDBC ou les ODBC pilotes compatibles avec la SAML version 2.0. Pour plus d'informations sur la configuration de l'accès fédéré à l'APIAthena, consultez. Activer l'accès fédéré à l'Athena API
Pour télécharger la version 2.0.6 du JDBC pilote et sa documentation, consultezConnectez-vous à Amazon Athena avec JDBC. Pour plus d'informations sur cette version, consultez les notes de mise à jour du JDBC pilote
Pour télécharger la version 1.0.4 du ODBC pilote et sa documentation, consultezConnectez-vous à Amazon Athena avec ODBC. Pour plus d'informations sur cette version, consultez les notes de mise à jour du ODBC pilote
Pour plus d'informations sur la prise en charge de la SAML version 2.0 dans AWS, consultez la section À propos de la fédération SAML 2.0 dans le guide de IAM l'utilisateur.
15 octobre 2018
Date de publication : 15/10/2018
Si vous avez effectué la mise à niveau vers le AWS Glue Data Catalog, deux nouvelles fonctionnalités permettent de prendre en charge les éléments suivants :
-
Chiffrement des métadonnées du catalogue de données. Si vous choisissez de chiffrer les métadonnées dans le catalogue de données, vous devez ajouter des politiques spécifiques à Athena. Pour en savoir plus, consultez Accès aux métadonnées chiffrées dans le AWS Glue Data Catalog.
-
Autorisations précises pour accéder aux ressources du. AWS Glue Data Catalog Vous pouvez désormais définir des politiques basées sur l'identité (IAM) qui limitent ou autorisent l'accès à des bases de données et à des tables spécifiques du catalogue de données utilisé dans Athena. Pour de plus amples informations, veuillez consulter Configurez l'accès aux bases de données et aux tables dans le AWS Glue Data Catalog.
Note
Les données résident dans les compartiments Amazon S3 et leur accès est contrôlé par Contrôlez l'accès à Amazon S3 depuis Athena. Pour accéder aux données des bases de données et des tables, continuez à utiliser des politiques de contrôle d'accès aux compartiments Simple Storage Service (Amazon S3) qui stockent les données.
10 octobre 2018
Date de publication : 10/10/2018
Athena prend en charge CREATE TABLE AS SELECT
, ce qui crée une table à partir du résultat d'une instruction de requête SELECT
. Pour plus de détails, voir Création d'une table à partir des résultats de requête (CTAS).
Avant de créer des CTAS requêtes, il est important de connaître leur comportement dans la documentation d'Athena. Il contient des informations sur l'emplacement d'enregistrement des résultats des requêtes dans Amazon S3, la liste des formats pris en charge pour le stockage des résultats des CTAS requêtes, le nombre de partitions que vous pouvez créer et les formats de compression pris en charge. Pour de plus amples informations, veuillez consulter Considérations et limites relatives aux CTAS requêtes.
Utilisez CTAS des requêtes pour :
-
Créez une table à partir des résultats de la requête en une étape.
-
Créez des CTAS requêtes dans la console Athena à l'aide d'exemples. Pour plus d'informations sur la syntaxe, consultez CREATETABLEAS.
-
Transformez les résultats des requêtes dans d'autres formats de stockagePARQUET, tels que ORCAVRO,JSON,, etTEXTFILE. Pour plus d’informations, consultez Considérations et limites relatives aux CTAS requêtes et Utiliser des formats de stockage en colonnes.
6 septembre 2018
Date de publication : 06/09/2018
Sortie de la nouvelle version du ODBC pilote (version 1.0.3). La nouvelle version du ODBC pilote diffuse les résultats par défaut, au lieu de les parcourir par pagination, ce qui permet aux outils de business intelligence de récupérer de grands ensembles de données plus rapidement. Cette version inclut également des améliorations, des corrections de bogues et une documentation mise à jour pour « Utilisation SSL avec un serveur proxy ». Pour plus de détails, consultez les Notes de mise à jour
Pour télécharger la version 1.0.3 du ODBC pilote et sa documentation, consultezConnectez-vous à Amazon Athena avec ODBC.
La fonctionnalité de diffusion des résultats est disponible avec cette nouvelle version du ODBC pilote. Il est également disponible avec le JDBC chauffeur. Pour plus d'informations sur les résultats du streaming, consultez le Guide d'installation et de configuration du ODBC pilote
La version 1.0.3 du ODBC pilote remplace directement la version précédente du pilote. Nous vous recommandons de migrer vers le pilote en cours.
Important
Pour utiliser la version 1.0.3 du ODBC pilote, respectez les exigences suivantes :
-
Gardez le port 444 ouvert pour le trafic sortant.
-
Ajoutez l'action de politique
athena:GetQueryResultsStream
à la liste des politiques pour Athena. Cette action politique n'est pas directement exposée aux pilotes API et n'est utilisée qu'avec les JDBC pilotes ODBC et, dans le cadre de la prise en charge des résultats de diffusion en continu. Pour un exemple de politique, consultez AWS politique gérée : AWSQuicksightAthenaAccess.
23 août 2018
Date de publication : 23/08/2018
Ajout de la prise en charge DDL de ces fonctionnalités connexes et correction de plusieurs bogues, comme suit :
-
Ajout de la prise en charge pour les types de données
BINARY
etDATE
des données dans Parquet, et pour les types de donnéesDATE
etTIMESTAMP
pour les données dans Avro. -
Ajout du support pour
INT
etDOUBLE
dans les DDL requêtes.INTEGER
est un alias deINT
, etDOUBLE PRECISION
est un alias deDOUBLE
. -
Amélioration des performances des requêtes
DROP TABLE
etDROP DATABASE
. -
Suppression de la création d'un objet
_$folder$
dans Simple Storage Service (Amazon S3) lorsqu'un compartiment de données est vide. -
Résolution d'un problème où
ALTER TABLE ADD PARTITION
génère une erreur quand aucune valeur de partition n'a été fournie. -
Résolution d'un problème où
DROP TABLE
a ignoré le nom de base de données lors de la vérification des partitions après que le nom qualifié a été spécifié dans l'instruction.
Pour plus d'informations sur les types de données prises en charge dans Athena, consultez Types de données dans Amazon Athena.
Pour plus d'informations sur les mappages de types de données pris en charge entre les types d'Athena, JDBC le pilote et les types de données Java, consultez la section « Types de données » du Guide d'installation et de configuration JDBC du pilote
16 août 2018
Date de publication : 16/08/2018
A publié la version 2.0.5 du JDBC pilote. La nouvelle version du JDBC pilote diffuse les résultats par défaut, au lieu de les parcourir par pagination, ce qui permet aux outils de business intelligence de récupérer de grands ensembles de données plus rapidement. Par rapport à la version précédente du JDBC pilote, les améliorations de performances sont les suivantes :
-
Augmentation des performances de 2 fois environ lors de l'extraction des performances de moins de 10 000 lignes.
-
Augmentation des performances de 5 à 6 fois environ lors de l'extraction des performances de plus de 10 000 lignes.
La fonction de diffusion des résultats n'est disponible qu'avec le JDBC pilote. Il n'est pas disponible avec le ODBC pilote. Vous ne pouvez pas l'utiliser avec l'AthénaAPI. Pour plus d'informations sur les résultats du streaming, consultez le Guide d'installation et de configuration du JDBC pilote
Pour télécharger la version 2.0.5 du JDBC pilote et sa documentation, consultezConnectez-vous à Amazon Athena avec JDBC.
La version 2.0.5 du JDBC pilote remplace directement la version précédente du pilote (2.0.2). Pour vous assurer que vous pouvez utiliser la version 2.0.5 du JDBC pilote, ajoutez l'action de athena:GetQueryResultsStream
stratégie à la liste des politiques pour Athena. Cette action de politique n'est pas présentée directement avec le pilote API et n'est utilisée qu'avec le JDBC pilote, dans le cadre de la prise en charge des résultats de streaming. Pour un exemple de politique, consultez AWS politique gérée : AWSQuicksightAthenaAccess. Pour plus d'informations sur la migration de la version 2.0.2 vers la version 2.0.5 du pilote, consultez le Guide de migration des JDBCpilotes
Si vous effectuez une migration depuis un pilote 1.x vers un pilote 2.x, vous devrez migrer vos configurations existantes vers la nouvelle configuration. Nous vous recommandons vivement de migrer vers la version courante du pilote. Pour plus d'informations, consultez le Guide de migration des JDBC pilotes
7 août 2018
Date de publication : 07/08/2018
Vous pouvez désormais stocker les journaux de flux Amazon Virtual Private Cloud directement dans Amazon S3 dans un GZIP format dans lequel vous pouvez les interroger dans Athena. Pour plus d'informations, consultez Interrogation des journaux de VPC flux Amazon et Amazon VPC Flow Logs peut désormais être transmis à S3
5 juin 2018
Date de publication : 05/06/2018
Rubriques
Prise en charge des vues
Ajout de la prise en charge des vues. Vous pouvez désormais utiliser CREATE VIEW and CREATE DIALECT VIEW, DESCRIBE VIEW, DROP VIEW, SHOW CREATE VIEW et SHOW VIEWS dans Athena. La requête qui définit la vue est exécutée chaque fois que vous référencez la vue dans votre requête. Pour de plus amples informations, veuillez consulter Travaillez avec des vues.
Améliorations et mises à jour des messages d'erreur
-
Une bibliothèque GSON 2.8.0 a été incluse dans le CloudTrail SerDe, pour résoudre un problème avec CloudTrail SerDe et permettre l'analyse des JSON chaînes.
-
Validation améliorée du schéma de partition dans Athena pour Parquet et, dans certains cas, pourORC, en permettant de réorganiser les colonnes. Cela permet à Athena de mieux gérer les modifications de l'évolution du schéma au fil du temps, ainsi que les tables ajoutées par le AWS Glue Crawler. Pour de plus amples informations, veuillez consulter Gérer les mises à jour du schéma.
-
Ajout de la prise en charge de l'analyse pour
SHOW VIEWS
. -
Améliorations suivantes apportées à la plupart des messages d'erreur courants :
-
Un message d'
erreur interne
a été remplacé par un message d'erreur descriptif en cas d' SerDe échec de l'analyse de la colonne dans une requête Athena. Auparavant, Athena émettait une erreur interne en cas d'erreurs d'analyse. Le nouveau message d'erreur se lit comme suit :"HIVE_ BAD _ DATA : Erreur lors de l'analyse de la valeur du champ 0 : java.lang.String ne peut pas être converti en org.openx.data.jsonserde.json. JSONObject
«. -
Amélioration des messages d'erreur concernant des autorisations insuffisantes par l'ajout de détails.
-
Correctifs de bogue
Les bogues suivants ont été corrigés :
-
Résolution d'un problème qui permet la conversion de
REAL
en types de donnéesFLOAT
. Cela améliore l'intégration au Crawler AWS Glue qui renvoie les types de donnéesFLOAT
. -
Correction d'un problème en raison duquel Athéna ne se convertissait pas AVRO
DECIMAL
(un type logique) en type.DECIMAL
-
Correction d'un problème pour lequel Athena ne renvoyait pas les résultats des requêtes sur les données Parquet avec des clauses
WHERE
faisant référence à des valeurs dans le type de donnéesTIMESTAMP
.
17 mai 2018
Date de publication : 17/05/2018
Augmentation des quotas de simultanéité des requêtes dans Athena de cinq à vingt. Cela signifie que vous pouvez soumettre et exécuter jusqu'à vingt requêtes DDL
et vingt requêtes SELECT
en même temps. Notez que les quotas de simultanéité sont distincts pour les requêtes DDL
et SELECT
.
Les quotas de simultanéité dans Athena sont définis en tant que nombre de requêtes pouvant être soumises au service simultanément. Vous pouvez soumettre jusqu'à vingt requêtes du même type (DDL
or SELECT
) en même temps. Si vous soumettez une requête qui dépasse le quota de requêtes simultanées, l'Athena API affiche un message d'erreur.
Une fois vos requêtes soumises à Athena, celui-ci traite les requêtes en affectant des ressources en fonction de la charge de service globale et du volume de demandes entrantes. Nous surveillons et apportons en continu les ajustements de service afin que le traitement de vos requêtes soit aussi rapide que possible.
Pour plus d’informations, veuillez consulter Service Quotas. Il s'agit d'un quota ajustable. Vous pouvez utiliser la console Service Quotas
19 avril 2018
Date de publication : 19/04/2018
Publication de la nouvelle version du JDBC pilote (version 2.0.2) avec prise en charge du renvoi des ResultSet
données sous forme de type de tableau, améliorations et corrections de bogues. Pour plus de détails, consultez les Notes de mise à jour
Pour plus d'informations sur le téléchargement de la nouvelle version du JDBC pilote 2.0.2 et de sa documentation, consultezConnectez-vous à Amazon Athena avec JDBC.
La dernière version du JDBC pilote est la 2.0.2. Si vous effectuez une migration depuis un pilote 1.x vers un pilote 2.x, vous devrez migrer vos configurations existantes vers la nouvelle configuration. Nous vous recommandons vivement de migrer vers le pilote en cours.
Pour plus d'informations sur les modifications introduites dans la nouvelle version du pilote, les différences de version et des exemples, consultez le Guide de migration des JDBC pilotes
6 avril 2018
Date de publication : 06/04/2018
Utilisation de la saisie semi-automatique pour saisir des requêtes dans la console Athena.
15 mars 2018
Date de publication : 15/03/2018
Ajout de la possibilité de créer automatiquement des tables Athena pour les fichiers CloudTrail journaux directement depuis la CloudTrail console. Pour plus d’informations, veuillez consulter Utiliser la CloudTrail console pour créer une table Athena pour les journaux CloudTrail .
2 février 2018
Date de publication : 12/02/2018
Ajout de la possibilité de décharger en toute sécurité des données intermédiaires sur le disque pour les requêtes nécessitant beaucoup de mémoire qui utilisent la clause GROUP BY
. Cela permet d'améliorer la fiabilité de ces requêtes et empêche les erreurs liées à l'épuisement des ressources de requête
.
19 janvier 2018
Date de publication : 19/01/2018
Athena utilise Presto, un moteur de requête open source, pour exécuter des requêtes.
Avec Athena, il n'y a pas de versions à gérer. Nous avons mis à niveau de façon transparente le moteur sous-jacent dans Athena vers une version basée sur Presto version 0.172. Aucune action de votre part n'est nécessaire.
Grâce à la mise à niveau, vous pouvez désormais utiliser les fonctions et opérateurs Presto 0.172, y compris les expressions Lambda Presto 0.172 dans Athena.
Les mises à jour majeures de cette version, y compris les corrections développées par la communauté, incluent :
-
Prise en charge du non-respect des en-têtes. Vous pouvez utiliser la propriété
skip.header.line.count
lors de la définition de tables pour autoriser Athena à ignorer les en-têtes. Ceci est pris en charge pour les requêtes qui utilisent le LazySimpleSerDeet Open CSV SerDe, et non pour Grok ou SerDes Regex. -
Prise en charge du type de données
CHAR(n)
dans les fonctionsSTRING
. La plage pourCHAR(n)
est[1.255]
, tandis que la plage pourVARCHAR(n)
est[1,65535]
. -
Prise en charge des sous-requêtes corrélées.
-
Prise en charge des expressions et fonctions lambda Presto.
-
Amélioration des performances du type
DECIMAL
et des opérateurs. -
Prise en charge des agrégations filtrées, telles que
SELECT sum(col_name) FILTER
, oùid > 0
. -
Déploiement des prédicats pour les types de données
DECIMAL
,TINYINT
,SMALLINT
etREAL
. -
Prise en charge des prédicats de comparaison quantifiée :
ALL
,ANY
etSOME
. -
Ajout des fonctions :
arrays_overlap()
, array_except()
, levenshtein_distance()
, codepoint()
, skewness()
, kurtosis()
et typeof()
. -
Ajout d'une variante de la fonction
from_unixtime()
qui accepte un argument de fuseau horaire. -
Ajout des fonctions d'agrégation
bitwise_and_agg()
et bitwise_or_agg()
. -
Ajout des fonctions
xxhash64()
et to_big_endian_64()
. -
Ajout de la possibilité d'éviter les guillemets ou les barres obliques inverses à l'aide d'une barre oblique inverse avec un indice de JSON chemin vers les fonctions et.
json_extract()
json_extract_scalar()
Cela change la sémantique de toute invocation utilisant une barre oblique inverse, étant donné que les barres obliques inverses étaient précédemment considérées comme des caractères normaux.
Pour plus d'informations sur les fonctions et les opérateurs, voir DMLrequêtes, fonctions et opérateurs dans ce guide et Fonctions et opérateurs
Athena ne prend pas en charge toutes les fonctions Presto. Pour plus d’informations, consultez Limites.
Notes de publication d'Athena pour 2017
13 novembre 2017
Date de publication : 13/11/2017
Ajout de la prise en charge de la connexion d'Athéna au ODBC pilote. Pour plus d’informations, veuillez consulter Connectez-vous à Amazon Athena avec ODBC.
1er novembre 2017
Date de publication : 01/11/2017
Ajout de la prise en charge pour les requêtes de données géospatiales, et pour les régions Asie-Pacifique (Séoul), Asie-Pacifique (Mumbai) et UE (Londres). Pour plus d'informations, consultez Interrogez des données géospatiales, Régions AWS et Points de terminaison.
19 octobre 2017
Date de publication : 19/10/2017
Ajout de la prise en charge pour UE (Francfort). Pour accéder à la liste des régions prises en charge, consultez Régions AWS et Points de terminaison.
3 octobre 2017
Date de publication : 03/10/2017
Créez des requêtes Athena nommées avec. AWS CloudFormation Pour plus d'informations, consultez AWS: :Athena : : NamedQuery dans le guide de l'AWS CloudFormation utilisateur.
25 septembre 2017
Date de publication : 25/09/2017
Ajout de la prise en charge de l'Asie-Pacifique (Sydney). Pour accéder à la liste des régions prises en charge, consultez Régions AWS et Points de terminaison.
14 août 2017
Date de publication : 14/08/2017
Ajout d'une intégration avec le AWS Glue Data Catalog et d'un assistant de migration pour la mise à jour du catalogue de données géré Athena vers le. AWS Glue Data Catalog Pour de plus amples informations, veuillez consulter AWS Glue À utiliser pour connecter Athena à vos données dans Amazon S3.
4 août 2017
Date de publication : 04/08/2017
Ajout de la prise en charge de Grok SerDe, qui facilite la correspondance de modèles pour les enregistrements dans des fichiers texte non structurés tels que les journaux. Pour de plus amples informations, veuillez consulter Grok SerDe. Des raccourcis clavier ont été ajoutés pour faire défiler l'historique des requêtes à l'aide de la console (CTRL+ ou Windows, CMD + ou Mac).
22 juin 2017
Date de publication : 22/06/2017
Ajout de la prise en charge des régions Asie-Pacifique (Tokyo) et Asie-Pacifique (Singapour). Pour accéder à la liste des régions prises en charge, consultez Régions AWS et Points de terminaison.
8 juin 2017
Date de publication : 08/06/2017
Ajout de la prise en charge de l'Europe (Irlande). Pour plus d’informations, consultez Régions AWS and Endpoints.
19 mai 2017
Date de publication : 19/05/2017
Ajout d'Amazon Athena API et du AWS CLI support pour Athena ; mise à jour du JDBC pilote vers la version 1.1.0 ; résolution de divers problèmes.
-
Amazon Athena permet la programmation d'application pour Athena. Pour plus d'informations, consultez le manuel Amazon Athena Reference API. Les derniers AWS SDKs incluent le support pour l'AthenaAPI. Pour obtenir des liens vers la documentation et les téléchargements, consultez la SDKssection Outils pour Amazon Web Services
. -
AWS CLI Cela inclut de nouvelles commandes pour Athéna. Pour plus d'informations, consultez le manuel Amazon Athena Reference API.
-
Un nouveau JDBC pilote 1.1.0 est disponible, qui supporte la nouvelle API Athena ainsi que les dernières fonctionnalités et corrections de bugs. Téléchargez le pilote sur https://downloads.athena.us-east-1.amazonaws.com/drivers/Athena JDBC41
-1.1.0.jar. Nous vous recommandons de passer à la dernière version du JDBC pilote Athena ; toutefois, vous pouvez toujours utiliser la version antérieure du pilote. Les versions antérieures du pilote ne sont pas compatibles avec l'AthenaAPI. Pour de plus amples informations, veuillez consulter Connectez-vous à Amazon Athena avec JDBC. -
Les actions spécifiques aux déclarations de politique dans les versions antérieures d'Athena sont désormais obsolètes. Si vous effectuez une mise à niveau vers la version 1.1.0 du JDBC pilote et que des IAM politiques gérées par le client ou intégrées sont associées aux JDBC utilisateurs, vous devez les mettre à jour. IAM En revanche, les versions antérieures du JDBC pilote ne prennent pas en charge l'AthenaAPI. Vous ne pouvez donc spécifier que des actions déconseillées dans les politiques associées aux utilisateurs des versions antérieures. JDBC Pour cette raison, vous ne devriez pas avoir à mettre à jour les politiques intégrées IAM ou gérées par le client.
-
Ces actions spécifiques aux politiques étaient utilisées dans Athena avant la sortie d'Athena. API Utilisez ces actions déconseillées dans les politiques uniquement avec des JDBC pilotes antérieurs à la version 1.1.0. Si vous mettez à niveau le JDBC pilote, remplacez les déclarations de politique autorisant ou refusant les actions déconseillées par les API actions appropriées répertoriées, sinon des erreurs se produiront :
Action spécifique de politique obsolète | Action Athéna API correspondante |
---|---|
|
|
|
|
|
|
Améliorations
-
Augmentation de la longueur limite des chaînes de requête à 256 Ko.
Correctifs de bogue
-
Correction d'un problème selon lequel des résultats de requête semblaient incorrects lorsque vous les faisiez défiler dans la console.
-
Correction d'un problème selon lequel une chaîne de caractères
\u0000
dans des fichiers de données Simple Storage Service (Amazon S3) entraînait des erreurs. -
Correction d'un problème en raison duquel les demandes d'annulation d'une requête effectuées via le JDBC pilote échouaient.
-
Correction d'un problème qui provoquait AWS CloudTrail SerDe l'échec des données Amazon S3 dans l'est des États-Unis (Ohio).
-
Résolution d'un problème lié à l'échec de
DROP TABLE
sur une table partitionnée.
4 avril 2017
Date de publication : 04/04/2017
Ajout de la prise en charge du chiffrement des données Amazon S3 et publication d'une mise à jour du JDBC pilote (version 1.0.1) avec prise en charge du chiffrement, améliorations et corrections de bogues.
Fonctionnalités
-
Les fonctionnalités de chiffrement suivantes ont été ajoutées :
-
Prise en charge des requêtes de données chiffrées dans Simple Storage Service (Amazon S3).
-
Prise en charge du chiffrement des résultats de requête Athena.
-
-
Une nouvelle version du pilote prend en charge les nouvelles fonctions de chiffrement, ajoute des améliorations et corrige des bogues.
-
Ajout de la possibilité d'ajouter, de remplacer et de modifier des colonnes avec
ALTER TABLE
. Pour plus d'informations, consultez Alter Columndans la documentation Hive. -
Ajout de la prise en charge de l'interrogation de données LZO compressées.
Pour de plus amples informations, veuillez consulter Chiffrement au repos.
Améliorations
-
Meilleures performances de JDBC requête grâce à l'amélioration de la taille des pages, renvoyant 1 000 lignes au lieu de 100.
-
Ajout de la possibilité d'annuler une requête à l'aide de l'interface du JDBC pilote.
-
Ajout de la possibilité de spécifier JDBC des options dans la JDBC connexionURL. Voir Connectez-vous à Amazon Athena avec JDBC pour le JDBC pilote le plus récent.
-
Ajout PROXY d'un paramètre dans le pilote, qui peut désormais être défini ClientConfigurationà l'aide AWS SDK de Java.
Correctifs de bogue
Les bogues suivants ont été corrigés :
-
Des erreurs de régulation se produisaient lorsque plusieurs requêtes étaient émises à l'aide de l'interface du JDBC pilote.
-
Le JDBC pilote s'arrêterait lors de la projection d'un type de données décimal.
-
Le JDBC pilote renverrait tous les types de données sous forme de chaîne, quelle que soit la manière dont le type de données a été défini dans la table. Par exemple, la sélection d'une colonne définie comme type de données
INT
en utilisantresultSet.GetObject()
renvoyait un type de donnéesSTRING
à la place d'un typeINT
. -
Le JDBC pilote vérifierait les informations d'identification au moment de l'établissement de la connexion, plutôt qu'au moment de l'exécution d'une requête.
-
Les requêtes effectuées via le JDBC pilote échouaient lorsqu'un schéma était spécifié avec leURL.
24 mars 2017
Date de publication : 24/03/2017
Ajout de l' AWS CloudTrail SerDeamélioration des performances, résolution des problèmes de partition.
Fonctionnalités
-
Ajouté le AWS CloudTrail SerDe, qui a depuis été remplacé par le Ruche JSON SerDe pour lire CloudTrail les journaux. Pour plus d'informations sur l'interrogation CloudTrail des journaux, consultezAWS CloudTrail Journaux de requêtes.
Améliorations
-
Amélioration des performances lors de l'analyse d'un grand nombre de partitions.
-
Amélioration des performances sur l'opération
MSCK Repair Table
. -
Ajout de la possibilité d'exécuter des requêtes sur les données Simple Storage Service (Amazon S3) stockées dans des régions autres que votre région principale. Les taux standard de transfert de données entre régions pour Simple Storage Service (Amazon S3) s'appliquent en plus des frais Athena standard.
Correctifs de bogue
-
Correction d'un bogue qui entraînait éventuellement une erreur de type « table introuvable » si aucune partition n'était chargée.
-
Correction d'un bogue pour éviter de lever une exception avec les requêtes
ALTER TABLE ADD PARTITION IF NOT EXISTS
. -
Correction d'un bogue dans
DROP PARTITIONS
.
20 février 2017
Date de publication : 20/02/2017
Ajout de la prise en charge de AvroSerDe et O penCSVSer De, de la région USA Est (Ohio) et de la modification groupée de colonnes dans l'assistant de console. Amélioration des performances sur les tables Parquet volumineuses.
Fonctionnalités
-
Support introduit pour les nouveaux SerDes :
-
Lancement de la région USA Est (Ohio) (us-east-2). Vous pouvez désormais exécuter des requêtes dans cette région.
-
Vous pouvez désormais utiliser le formulaire Create Table From S3 bucket data (Créer une table à partir des données du compartiment S3) pour définir le schéma de table en bloc. Dans l'éditeur de requêtes, choisissez Create (Créer), S3 bucket data (Données du compartiment S3), puis Bulk add columns (Ajout de colonnes en bloc) dans la section Column details (Détails de la colonne).
Tapez des paires nom/valeur dans la zone de texte et choisissez Add.
Améliorations
-
Amélioration des performances sur les tables Parquet volumineuses.