Amazon Athena Amazon EMR Amazon Redshift

Quand utiliser Athena ?

Les services de requêtes tels qu'Amazon Athena, les entrepôts de données tels qu'Amazon Redshift et les frameworks de traitement de données sophistiqués tels qu'EMRAmazon répondent tous à des besoins et à des cas d'utilisation différents. Les indications suivantes peuvent vous aider à choisir un ou plusieurs services en fonction de vos besoins.

Amazon Athena

Athena vous aide à analyser les données non structurées, semi-structurées et structurées, stockées dans Simple Storage Service (Amazon S3). Les exemples incluent CSVJSON, ou les formats de données en colonnes tels que Apache Parquet et ApacheORC. Vous pouvez utiliser Athena pour exécuter des requêtes ad hoc en utilisant ANSISQL, sans avoir besoin d'agréger ou de charger les données dans Athena.

Athena s'intègre à Amazon QuickSight pour faciliter la visualisation des données. Vous pouvez utiliser Athena pour générer des rapports ou pour explorer des données à l'aide d'outils de business intelligence ou de SQL clients connectés à un chauffeur JDBC ou à un ODBC chauffeur. Pour plus d'informations, consultez What is Amazon QuickSight dans le guide de QuickSight l'utilisateur Amazon etConnectez-vous à Amazon Athena avec et avec vos chauffeurs ODBC JDBC.

Athena s'intègre au AWS Glue Data Catalog, qui propose un stockage de métadonnées permanent pour vos données dans Amazon S3. Cela vous permet de créer des tables et de demander des données dans Athena sur la base d'un magasin de métadonnées central disponible sur votre compte Amazon Web Services et intégré aux fonctionnalités de ETL découverte de données de. AWS Glue Pour plus d'informations, consultez AWS Glue À utiliser pour connecter Athena à vos données dans Amazon S3 et Présentation de AWS Glue dans le Guide du développeur AWS Glue .

Amazon Athena facilite l'exécution de requêtes interactives sur des données dans Simple Storage Service (Amazon S3) sans avoir à formater les données ni à gérer l'infrastructure. Par exemple, Athena est utile si vous souhaitez exécuter une requête rapide sur les journaux Web pour résoudre un problème de performances sur votre site. Avec Athena, vous pouvez démarrer rapidement : il vous suffit de définir une table pour vos données et de commencer à interroger en utilisant le standard. SQL

Vous devez utiliser Amazon Athena si vous souhaitez exécuter des SQL requêtes ad hoc interactives sur des données sur Amazon S3, sans avoir à gérer d'infrastructure ou de clusters. Amazon Athena offre le moyen le plus simple d'exécuter des requêtes ad hoc pour des données dans Simple Storage Service (Amazon S3) sans avoir besoin de configurer ou de gérer aucun serveur.

Pour une liste des éléments Services AWS qu'Athena utilise ou auxquels elle s'intègre, consultez. Service AWS intégrations avec Athena

Amazon EMR

Amazon EMR simplifie et rentabilise l'exécution de frameworks de traitement hautement distribués tels que Hadoop, Spark et Presto par rapport aux déploiements sur site. Amazon EMR est flexible : vous pouvez exécuter des applications et du code personnalisés, et définir des paramètres spécifiques de calcul, de mémoire, de stockage et d'application afin d'optimiser vos exigences analytiques.

Outre l'exécution de SQL requêtes, Amazon EMR peut exécuter une grande variété de tâches de traitement des données évolutives pour des applications telles que l'apprentissage automatique, l'analyse de graphes, la transformation de données, le streaming de données et pratiquement tout ce que vous pouvez coder. Vous devez utiliser Amazon EMR si vous utilisez du code personnalisé pour traiter et analyser des ensembles de données extrêmement volumineux avec les derniers frameworks de traitement des mégadonnées tels que Spark, Hadoop, Presto ou Hbase. Amazon vous EMR donne le contrôle total de la configuration de vos clusters et des logiciels qui y sont installés.

Vous pouvez utiliser Amazon Athena pour interroger les données que vous traitez à l'aide d'Amazon. EMR Amazon Athena prend en charge de nombreux formats de données identiques à ceux d'Amazon. EMR Le catalogue de données d'Athena est compatible avec les metastores Hive. Si vous utilisez EMR et possédez déjà un métastore Hive, vous pouvez exécuter vos DDL relevés sur Amazon Athena et interroger vos données immédiatement sans affecter vos tâches Amazon. EMR

Amazon Redshift

Un entrepôt de données comme Amazon Redshift est votre meilleur choix lorsque vous devez rassembler des données provenant de nombreuses sources différentes (comme les systèmes d'inventaire, les systèmes financiers et les systèmes de vente au détail) dans un format commun et les stocker pendant de longues périodes. Si vous souhaitez créer des rapports métier sophistiqués à partir de données historiques, un entrepôt de données tel qu'Amazon Redshift est le meilleur choix. Le moteur de requête d'Amazon Redshift a été optimisé pour fonctionner particulièrement bien sur l'exécution de requêtes complexes qui rejoignent un grand nombre de tables de bases de données très volumineuses. Lorsque vous devez exécuter des requêtes sur des données hautement structurées avec de nombreuses jointures sur de nombreuses tables très volumineuses, choisissez Amazon Redshift.

Pour plus d'informations sur le moment où il convient d'utiliser Athena, consultez les ressources suivantes :

Guide de décision pour les services d'analyse sur AWS dans Premiers pas avec le Centre de ressources
Quand utiliser Athena par rapport aux autres services de mégadonnées d'Amazon Athena FAQs
Présentation d'Amazon Athena
Fonctions Amazon Athena
Amazon Athéna FAQs
Articles du blog Amazon Athena

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Qu'est-ce que Amazon Athena ?

Façons d'utiliser Athena