Parcourez les données avec SQL Explorer - Amazon EMR

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Parcourez les données avec SQL Explorer

Note

SQLExplorer for EMR Studio n'est pas compatible avec les applications interactives Amazon EMR Serverless ou dans un studio dans lequel la propagation d'IAMidentité sécurisée Identity Center est activée.

Cette rubrique fournit des informations qui vous aideront à démarrer avec SQL Explorer dans Amazon EMR Studio. SQLExplorer est un outil d'une seule page intégré à votre espace de travail qui vous aide à comprendre les sources de données du catalogue de données de votre EMR cluster. Vous pouvez utiliser SQL Explorer pour parcourir vos données, exécuter des SQL requêtes pour récupérer des données et télécharger les résultats des requêtes.

SQLExplorer est compatible avec Presto. Avant d'utiliser SQL Explorer, assurez-vous que vous disposez d'un cluster qui utilise Amazon EMR version 5.34.0 ou ultérieure ou version 6.4.0 ou ultérieure avec Presto installé. Amazon EMR Studio SQL Explorer ne prend pas en charge les clusters Presto que vous avez configurés avec le chiffrement en transit. Cela est dû au fait que Presto s'exécute en TLS mode sur ces clusters.

Parcourez le catalogue de données de votre cluster

SQLExplorer fournit une interface de navigateur de catalogue que vous pouvez utiliser pour explorer et comprendre comment vos données sont organisées. Par exemple, vous pouvez utiliser le navigateur de catalogue de données pour vérifier les noms des tables et des colonnes avant d'écrire une SQL requête.

Parcourir votre catalogue de données
  1. Ouvrez SQL Explorer dans votre espace de travail.

  2. Assurez-vous que votre espace de travail est attaché à un EMR cluster exécuté sur EC2 Amazon EMR version 6.4.0 ou ultérieure avec Presto installé. Choisissez un cluster existant ou créez-en un. Pour de plus amples informations, veuillez consulter Associer un ordinateur à un espace de travail de EMR studio.

  3. Sélectionnez une base de données dans la liste déroulante pour la parcourir.

  4. Développez un tableau dans votre base de données pour voir les noms des colonnes du tableau. Vous pouvez également saisir un mot clé dans la barre de recherche pour filtrer les résultats dans le tableau.

Exécuter une SQL requête pour récupérer des données

Pour récupérer des données à l'aide d'une SQL requête et télécharger les résultats
  1. Ouvrez SQL Explorer dans votre espace de travail.

  2. Assurez-vous que votre espace de travail est attaché à un EMR cluster exécuté sur lequel EC2 Presto et Spark sont installés. Choisissez un cluster existant ou créez-en un. Pour de plus amples informations, veuillez consulter Associer un ordinateur à un espace de travail de EMR studio.

  3. Sélectionnez Ouvrir l'éditeur pour ouvrir un nouvel onglet d'éditeur dans votre Workspace.

  4. Rédigez votre SQL requête dans l'onglet de l'éditeur.

  5. Cliquez sur Exécuter.

  6. Consultez les résultats de votre requête sous Aperçu des résultats. SQLL'explorateur affiche les 100 premiers résultats par défaut. Vous pouvez choisir un nombre différent de résultats à afficher (jusqu'à 1 000) à l'aide de la liste déroulante Aperçu des 100 premiers résultats de requête.

  7. Choisissez Télécharger les résultats pour télécharger vos résultats au CSV format. Vous pouvez télécharger jusqu'à 1 000 lignes de résultats.