Utilisation de Databricks dans QuickSight - Amazon QuickSight

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation de Databricks dans QuickSight

Utilisez cette section pour savoir comment vous QuickSight connecter depuis Databricks.

Se connecter à Databricks
  1. Commencez par créer un nouveau jeu de données. Choisissez Jeux de données dans le volet de navigation de gauche, puis choisissez Nouveau jeu de données.

  2. Choisissez la carte de source de données Databricks.

  3. Pour le Nom de la source de données, entrez un nom descriptif pour votre connexion à la source de données Databricks, par exemple Databricks CS. Comme vous pouvez créer de nombreux jeux de données à partir d'une connexion à Databricks, il est préférable de conserver un nom simple.

    La capture d'écran suivante montre l'écran de connexion pour Databricks.

    Capture d'écran pour une nouvelle source de données Databricks. Il affiche tous les champs décrits dans cette section. Le bouton bleu permet de créer une source de données, en bas à droite ; il peut être activé en appuyant sur ENTRER.
  4. Pour Type de connexion, sélectionnez le type de réseau que vous utilisez.

    • Réseau public : si vos données sont partagées publiquement.

    • VPC : si vos données se trouvent dans un VPC.

    Note

    Si vous utilisez un VPC et que celui-ci n'apparaît pas dans la liste, contactez votre administrateur.

  5. Pour le serveur de base de données, saisissez le nom d'hôte de l'espace de travail spécifié dans les détails de votre connexion Databricks.

  6. Pour Chemin HTTP, saisissez l'URL partielle de l'instance Spark spécifiée dans les détails de votre connexion Databricks.

  7. Pour Port, saisissez le port spécifié dans les détails de votre connexion Databricks.

  8. Dans Nom d'utilisateur et Mot de passe, saisissez vos informations de connexion.

  9. Pour vérifier que la connexion fonctionne, cliquez sur Valider la connexion.

  10. Pour terminer et créer la source de données, cliquez sur Créer une source de données.

Ajouter un nouveau QuickSight jeu de données pour Databricks

Après avoir établi une connexion à une source de données existante pour les données Databricks, vous pouvez créer des jeux de données Databricks à utiliser pour l'analyse.

Créer un jeu de données avec Databricks
  1. Choisissez Jeux de données sur la gauche, puis faites défiler la page vers le bas pour trouver la carte de source de données pour votre connexion Databricks. Si vous avez de nombreuses sources de données, vous pouvez utiliser la barre de recherche en haut de la page pour trouver un correspondance partielle avec votre source de données.

  2. Choisissez la carte de source de données Databricks, puis choisissez Créer un jeu de données. La fenêtre contextuelle suivante s'affiche :

    Image d'un écran intitulé Choisissez votre tableau. Il affiche les champs décrits dans cette section. Il existe deux boutons en bas à gauche : l'un sert à modifier et à prévisualiser les données, l'autre permet d'utiliser du code SQL personnalisé. Pour sélectionner le tableau, activez le bouton bleu en bas à droite en appuyant sur ENTER.
  3. Pour spécifier le tableau auquel vous souhaitez vous connecter, sélectionnez d'abord le catalogue et le schéma que vous souhaitez utiliser. Ensuite, dans Tableaux, sélectionnez le tableau que vous souhaitez utiliser. Si vous préférez utiliser votre propre instruction SQL, sélectionnez Utiliser un code SQL personnalisé.

  4. Choisissez Modifier/apercevoir.

  5. (En option) Pour ajouter d'autres données, procédez comme suit :

    1. Choisissez Ajouter des données en haut à droite.

    2. Pour vous connecter à différentes données, choisissez Changer de source de données, puis choisissez un autre jeu de données.

    3. Suivez les instructions de l'interface utilisateur et terminez l'ajout de données.

    4. Après avoir ajouté de nouvelles données au même jeu de données, sélectionnez Configurer cette jointure (les deux points rouges). Configurez une jointure pour chaque tableau supplémentaire.

    5. Pour ajouter des champs calculés, Sélectionnez Ajouter un champ calculé.

    6. Pour ajouter un modèle à partir de SageMaker, choisissez Augmenter avec SageMaker. Cette option n'est disponible que dans QuickSight l'édition Enterprise.

    7. Décochez tous les champs que vous souhaitez omettre.

    8. Mettez à jour les types de données que vous souhaitez modifier.

  6. Lorsque vous avez terminé, sélectionnez Enregistrer pour enregistrer et fermer le jeu de données.