

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Utilisation de Databricks dans Quick Sight
<a name="quicksight-databricks"></a>

Utilisez cette section pour savoir comment vous connecter de Quick Sight à Databricks. 

**Se connecter à Databricks**

1. Commencez par créer un nouveau jeu de données. Choisissez **Data** dans le volet de navigation de gauche.

1. Choisissez **Créer** puis **Nouvel ensemble de données**.

1. Choisissez la carte de source de données **Databricks**.

1. Pour le **Nom de la source de données**, entrez un nom descriptif pour votre connexion à la source de données Databricks, par exemple `Databricks CS`. Comme vous pouvez créer de nombreux jeux de données à partir d’une connexion à Databricks, il est préférable de conserver un nom simple.

1. Pour **Type de connexion**, sélectionnez le type de réseau que vous utilisez. 
   + **Réseau public** : si vos données sont partagées publiquement.
   + **VPC** : si vos données se trouvent dans un VPC. 
**Note**  
Si vous utilisez un VPC et que celui-ci n’apparaît pas dans la liste, contactez votre administrateur. 

1.  Pour le **serveur de base de données**, saisissez le **nom d’hôte de l’espace de travail** spécifié dans les détails de votre connexion Databricks.

1.  Pour **Chemin HTTP**, saisissez l’**URL partielle de l’instance Spark** spécifiée dans les détails de votre connexion Databricks.

1.  Pour **Port**, saisissez le **port** spécifié dans les détails de votre connexion Databricks.

1.  Dans **Nom d’utilisateur** et **Mot de passe**, saisissez vos informations de connexion.

1.  Pour vérifier que la connexion fonctionne, cliquez sur **Valider la connexion**.

1.  Pour terminer et créer la source de données, cliquez sur **Créer une source de données**.

## Ajouter un nouveau jeu de données Quick Sight pour Databricks
<a name="quicksight-databricks-create-dataset"></a>

Après avoir établi une connexion à une source de données existante pour les données Databricks, vous pouvez créer des jeux de données Databricks à utiliser pour l’analyse. 

**Créer un jeu de données avec Databricks**

1. Choisissez **Data** sur la gauche, puis faites défiler l'écran vers le bas pour trouver la carte de source de données pour votre connexion Databricks. Si vous avez de nombreuses sources de données, vous pouvez utiliser la barre de recherche en haut de la page pour trouver un correspondance partielle avec votre source de données.

1. Choisissez la carte de source de données **Databricks**, puis choisissez **Créer un jeu de données**.

1. Pour spécifier le tableau auquel vous souhaitez vous connecter, sélectionnez d’abord le catalogue et le schéma que vous souhaitez utiliser. Ensuite, dans **Tableaux**, sélectionnez le tableau que vous souhaitez utiliser. Si vous préférez utiliser votre propre instruction SQL, sélectionnez **Utiliser un code SQL personnalisé**. 

1. Choisissez **Modifier/apercevoir**.

1. (En option) Pour ajouter d’autres données, procédez comme suit : 

   1. Choisissez **Ajouter des données** en haut à droite.

   1. Pour vous connecter à différentes données, choisissez **Changer de source de données**, puis choisissez un autre jeu de données. 

   1. Suivez les instructions de l’interface utilisateur et terminez l’ajout de données. 

   1. Après avoir ajouté de nouvelles données au même jeu de données, sélectionnez **Configurer cette jointure** (les deux points rouges). Configurez une jointure pour chaque tableau supplémentaire. 

   1. Pour ajouter des champs calculés, Sélectionnez **Ajouter un champ calculé**. 

   1. Pour ajouter un modèle issu de SageMaker l'IA, choisissez **Augmenter avec SageMaker.** Cette option n'est disponible que dans l'édition Quick Enterprise.

   1. Décochez tous les champs que vous souhaitez omettre.

   1. Mettez à jour les types de données que vous souhaitez modifier.

1. Lorsque vous avez terminé, sélectionnez **Enregistrer** pour enregistrer et fermer le jeu de données. 

## Guide de connexion à Databricks destiné à l'administrateur de Quick Sight
<a name="quicksight-databricks-administration-setup"></a>

Vous pouvez utiliser Amazon Quick Sight pour vous connecter à Databricks sur. AWS Vous pouvez vous connecter à Databricks, AWS que vous vous soyez inscrit via AWS Marketplace ou via le site Web de Databricks. 

Avant de pouvoir vous connecter à Databricks, vous devez créer ou identifier les ressources existantes requises par la connexion. Utilisez cette section pour vous aider à rassembler les ressources dont vous avez besoin pour vous connecter de Quick Sight à Databricks.
+ Pour savoir comment obtenir les détails de votre connexion Databricks, consultez [Connexions Databricks ODBCet JDBC](https://docs.databricks.com/integrations/jdbc-odbc-bi.html#get-server-hostname-port-http-path-and-jdbc-url). 
+ Pour savoir comment obtenir vos informations d’identification Databricks (jeton d’accès personnel ou nom d’utilisateur et mot de passe) à des fins d’authentification, consultez la section [Exigences d’authentification](https://docs.databricks.com/integrations/bi/jdbc-odbc-bi.html#authentication-requirements) dans la [documentation Databricks](https://docs.databricks.com/index.html). 

  Pour vous connecter à un cluster Databricks, vous avez besoin d’autorisations `Can Attach To` et `Can Restart`. Ces autorisations sont gérées dans Databricks. Pour plus d’informations, consultez la section [Exigences relatives aux autorisations](https://docs.databricks.com/integrations/jdbc-odbc-bi.html#permission-requirements) dans la [documentation Databricks.](https://docs.databricks.com/index.html)
+ Si vous configurez une connexion privée pour Databricks, vous pouvez en savoir plus sur la configuration d'un VPC pour une utilisation avec Quick Sight. Consultez la section Connexion [à un VPC avec Amazon Quick Sight dans la documentation de Quick](https://docs.aws.amazon.com/quicksight/latest/user/working-with-aws-vpc.html) Sight. Si la connexion n’est pas visible, vérifiez auprès d’un administrateur système que le réseau dispose de [points de terminaison entrants ouverts pour Amazon Route 53](https://docs.aws.amazon.com/quicksight/latest/user/vpc-route-53.html). Le nom d’hôte d’un espace de travail Databricks utilise une adresse IP publique, ainsi, des règles DNS TCP et DNS UDP entrantes et sortantes sont nécessaires pour autoriser le trafic sur le port DNS 53, à destination du groupe de sécurité Route 53. L’administrateur doit créer un groupe de sécurité avec deux règles entrantes : une pour le DNS (TCP) sur le port 53 du CIDR VPC, et une pour le DNS (UDP) pour le port 53 du CIDR VPC. 

  [Pour plus d'informations sur Databricks, si vous utilisez une connexion PrivateLink plutôt qu'une connexion publique, consultez la section [Activer AWS PrivateLink](https://docs.databricks.com/administration-guide/cloud-configurations/aws/privatelink.html) dans la documentation Databricks.](https://docs.databricks.com/index.html) 