Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Création de jeux de données
<a name="creating-data-sets"></a>

 Vous pouvez créer des ensembles de données à partir de sources de données nouvelles ou existantes dans Amazon Quick. Vous pouvez utiliser diverses sources de données de base de données pour fournir des données à Amazon Quick. Cela inclut les instances Amazon RDS et les clusters Amazon Redshift. Ceci inclut également les instances MariaDB, Microsoft SQL Server, MySQL, Oracle et PostgreSQL de votre organisation, dans Amazon EC2, ou des environnements similaires. 

**Topics**
+ [Création de jeux de données à l’aide de nouvelles sources de données](creating-data-sets-new.md)
+ [Création d’un jeu de données à partir d’une source de données existante](create-a-data-set-existing.md)
+ [Création d'un ensemble de données à partir d'un ensemble de données existant dans Amazon Quick](create-a-dataset-existing-dataset.md)

# Création de jeux de données à l’aide de nouvelles sources de données
<a name="creating-data-sets-new"></a>

Lorsque vous créez un ensemble de données basé sur un AWS service tel qu'Amazon RDS, Amazon Redshift ou Amazon EC2, des frais de transfert de données peuvent s'appliquer lors de la consommation de données provenant de cette source. Ces frais peuvent également varier selon que cette AWS ressource se trouve ou non dans la maison Région AWS que vous avez choisie pour votre compte Amazon Quick. Reportez-vous à la page de tarification du service en question pour des informations de tarification.

Lors de la création d’un jeu de données de base de données, vous pouvez sélectionner une table, joindre plusieurs tables ou créer une requête SQL pour récupérer les données de votre choix. Vous pouvez également décider si le jeu de données utilise une requête directe ou stocke les données dans [SPICE](spice.md).

**Pour créer un jeu de données**

1. Pour créer un jeu de données, sélectionnez **Nouveau jeu de données** sur la page **Données**. Vous pouvez ensuite créer un jeu de données basé sur une source de données existante, ou vous connecter à une nouvelle source de données et baser le jeu de données dessus.

1. Fournissez les informations de connexion à la source de données  :
   + Pour les fichiers texte ou Microsoft Excel locaux, vous pouvez simplement identifier l’emplacement du fichier et télécharger le fichier.
   + Pour Amazon S3, vous devez fournir un manifeste identifiant les fichiers ou compartiments que vous souhaitez utiliser, et aussi les paramètres d’importation pour les fichiers cibles.
   + Pour Amazon Athena, toutes les bases de données Athena associées à votre AWS compte sont renvoyées. Aucune information d’identification supplémentaire n’est obligatoire.
   + Pour Salesforce, vous devez fournir les informations d’identification de connexion.
   + Pour Amazon Redshift, Amazon RDS, Amazon EC2, ou d’autres sources de données de base de données, vous devez fournir des informations sur le serveur et la base de données qui hébergent les données. Vous devez également fournir des informations d’identification valides pour cette instance de base de données.

# Création d’un jeu de données à partir d’une base de données
<a name="create-a-database-data-set"></a>

Les procédures suivantes vous guident pour vous connecter aux sources de données de base de données et pour créer des jeux de données. Pour créer des ensembles de données à partir de sources de AWS données découvertes automatiquement par votre compte Amazon Quick, utilisez. [Création d’un jeu de données à partir d’un cluster Amazon Redshift ou d’une instance Amazon RDS découvert(e) automatiquement](#create-a-data-set-autodiscovered) Pour créer des jeux de données à partir de toute autre source de données de base de données, utilisez [Création d’un jeu de données à partir d’une base de données qui n’est pas découverte automatiquement](#create-a-data-set-database). 

## Création d’un jeu de données à partir d’un cluster Amazon Redshift ou d’une instance Amazon RDS découvert(e) automatiquement
<a name="create-a-data-set-autodiscovered"></a>

Utilisez la procédure suivante pour créer une connexion à une source de données AWS détectée automatiquement.

**Pour créer une connexion à une source de AWS données découverte automatiquement**

1. Vérifiez les [Quotas de source de données](data-source-limits.md) pour vous assurer que votre table ou requête cible ne dépasse pas les quotas de source de données.

1. Confirmez que les informations d’identification de la base de données que vous prévoyez disposent des autorisations nécessaires présentées sur la page [Autorisations requises](required-permissions.md). 

1. Assurez-vous d'avoir configuré le cluster ou l'instance pour l'accès rapide à Amazon en suivant les instructions de[Exigences de configuration de réseau et de bases de données](configure-access.md).

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez l'icône **RDS** ou **Redshift** Auto-discovered, selon AWS le service auquel vous souhaitez vous connecter.

1. Saisissez les informations de connexion pour la source de données, comme suit :
   + Dans **Data source name (Nom de la source de données)**, attribuez un nom à la source de données.
   + Pour **Instance ID (ID d’instance)**, choisissez le nom de l’instance ou du cluster auquel vous souhaitez vous connecter.
   + **Database name** présente la base de données par défaut pour le cluster ou l’instance **Instance ID**. Si vous souhaitez utiliser une base de données différente sur le cluster ou sur l’instance, tapez son nom.
   + Pour **UserName**, entrez le nom d'utilisateur d'un compte utilisateur autorisé à effectuer les opérations suivantes : 
     + Accédez à la base de données cible. 
     + Lisez (exécutez une instruction `SELECT` dessus) toutes les tables de la base de données que vous souhaitez utiliser.
   + Pour **Mot de passe**, entrez le mot de passe du compte que vous avez entré.

1. Choisissez **Validate connection** pour vérifier l’exactitude de vos informations de connexion.

1. Si la connexion est valide, choisissez **Create data source**. Dans le cas contraire, corrigez les informations de connexion et essayez à nouveau de valider.
**Note**  
Amazon Quick sécurise automatiquement les connexions aux instances Amazon RDS et aux clusters Amazon Redshift à l'aide du protocole SSL (Secure Sockets Layer). Vous n’avez pas besoin de faire quoi que ce soit.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tableaux spécifiques, pour **Schéma : contient des ensembles de tableaux**, choisissez **Sélectionner**, puis choisissez un schéma. Dans certains cas où la base de données ne contient qu’un seul schéma, celui-ci est choisi automatiquement et l’option de sélection de schémas ne s’affiche pas.

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Choisissez l’une des options suivantes :
   + Préparez les données avant de créer une analyse. Pour ce faire, choisissez **Edit/Preview data (Modifier/Prévisualiser les données)** pour ouvrir la préparation des données pour la table sélectionnée. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse en utilisant les données du tableau telles quelles, ainsi que pour importer les données du jeu de données dans SPICE pour améliorer les performances (recommandé). Pour ce faire, vérifiez la taille de la table et l’indicateur SPICE pour voir si vous avez suffisamment de capacité.

     Si vous avez suffisamment de capacité SPICE, choisissez **Importer vers SPICE pour des analyses plus rapides**, puis créez une analyse en choisissant **Visualiser**.
**Note**  
Si vous souhaitez utiliser SPICE et que vous n’avez pas suffisamment d’espace, choisissez **Modifier/apercevoir des données**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données afin d’en réduire la taille. Vous pouvez également appliquer un filtre ou écrire une requête SQL qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Pour créer un jeu de données et une analyse à l’aide des données d’un tableau telles quelles, et pour que les données soient interrogées directement à partir de la base de données, choisissez **Interroger directement vos données**. Créez ensuite une analyse en choisissant **Visualize (Visualiser)**.

## Création d’un jeu de données à partir d’une base de données qui n’est pas découverte automatiquement
<a name="create-a-data-set-database"></a>

Utilisez la procédure suivante pour créer une connexion à une base de données autre qu’un cluster Amazon Redshift ou une instance Amazon RDS découvert(e) automatiquement. Ces bases de données incluent les clusters Amazon Redshift et les instances Amazon RDS qui se trouvent dans un autre compte Région AWS ou qui sont associées à un autre compte. AWS Elles incluent également les instances MariaDB, Microsoft SQL Server, MySQL, Oracle et PostgreSQL qui sont sur site, dans Amazon EC2 ou dans un autre environnement accessible.

**Créer une connexion à une base de données qui n’est pas un cluster Amazon Redshift ou une instance RDS découverts automatiquement**

1. Vérifiez les [Quotas de source de données](data-source-limits.md) pour vous assurer que votre table ou requête cible ne dépasse pas les quotas de source de données.

1. Confirmez que les informations d’identification de la base de données que vous prévoyez disposent des autorisations nécessaires présentées sur la page [Autorisations requises](required-permissions.md). 

1. Assurez-vous d'avoir configuré le cluster ou l'instance pour l'accès rapide à Amazon en suivant les instructions de[Exigences de configuration de réseau et de bases de données](configure-access.md).

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Gérer les données**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez l'icône de **connexion manuelle Redshift** si vous souhaitez vous connecter à un cluster Amazon Redshift situé dans un Région AWS autre ou associé à un autre compte. AWS Sinon, choisissez l’icône de système de gestion de base de données approprié pour se connecter à une instance Amazon Aurora, MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL.

1. Saisissez les informations de connexion pour la source de données, comme suit :
   + Dans **Data source name (Nom de la source de données)**, attribuez un nom à la source de données.
   + Pour **Database server (Serveur de base de données)**, entrez l’une des valeurs suivantes :
     + Pour un cluster Amazon Redshift ou une instance Amazon RDS, tapez le point de terminaison du cluster ou de l’instance sans le numéro de port. Par exemple, si la valeur du point de terminaison est `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`, entrez `clustername.1234abcd.us-west-2.redshift.amazonaws.com`. Vous pouvez obtenir la valeur du point de terminaison dans le champ **Point** de terminaison de la page détaillée du cluster ou de l'instance dans la AWS console.
     + Pour une instance Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL, tapez l’adresse du DNS public. Vous pouvez obtenir la valeur DNS publique à partir du champ **Public DNS** dans le volet de détail d’instance dans la console Amazon EC2.
     + Pour un instance autre qu’une instance Amazon EC2 de MariaDB, Microsoft SQL Server, MySQL, Oracle ou PostgreSQL, tapez le nom d’hôte ou l’adresse IP publique du serveur de base de données. Si vous utilisez SSL (Secure Sockets Layer) pour obtenir une connexion sécurisée (recommandé), vous devez probablement fournir le nom de l’hôte pour établir une correspondance avec les informations requises par le certificat SSL. Pour obtenir une liste des certificats acceptés, consultez [Certificats Amazon Quick SSL et CA](configure-access.md#ca-certificates).
   + Pour **Port**, tapez le port que le cluster ou l’instance utilise pour les connexions.
   + Pour **Database name (Nom de la base de données)**, tapez le nom de la base de données que vous souhaitez utiliser.
   + Pour **UserName**, entrez le nom d'utilisateur d'un compte utilisateur autorisé à effectuer les opérations suivantes : 
     + Accédez à la base de données cible. 
     + Lisez (exécutez une instruction `SELECT` dessus) toutes les tables de la base de données que vous souhaitez utiliser.
   + Dans **Mot de passe**, tapez le mot de passe associé au compte que vous avez entré.

1. (Facultatif) Si vous vous connectez à autre chose qu’un cluster Amazon Redshift et que vous ne voulez *pas* d’une connexion sécurisée, assurez-vous que l’option **Activer SSL** est désactivée. *Nous vous recommandons vivement de laisser la case cochée*, car une connexion non sécurisée peut faire l’objet d’une effraction. 

   Pour plus d’informations sur la façon dont l’instance cible utilise le protocole SSL pour sécuriser les connexions, consultez la documentation concernant le système de gestion de base de données cible. Amazon Quick n'accepte pas les certificats SSL auto-signés comme valides. Pour obtenir une liste des certificats acceptés, consultez [Certificats Amazon Quick SSL et CA](configure-access.md#ca-certificates).

   Amazon Quick sécurise automatiquement les connexions aux clusters Amazon Redshift à l'aide du protocole SSL. Vous n’avez pas besoin de faire quoi que ce soit.

   Certaines bases de données, telles que Presto et Apache Spark, doivent répondre à des exigences supplémentaires avant qu'Amazon Quick puisse se connecter. Pour de plus amples informations, consultez [Création d’une source de données en utilisant Presto](create-a-data-source-presto.md) ou [Création d’une source de données en utilisant Apache Spark](create-a-data-source-spark.md).

1. (Facultatif) Choisissez **Validate connection** pour vérifier l’exactitude de vos informations de connexion.

1. Si la connexion est valide, choisissez **Create data source**. Dans le cas contraire, corrigez les informations de connexion et essayez à nouveau de valider.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tableaux spécifiques, pour **Schéma : contient des ensembles de tableaux**, choisissez **Sélectionner**, puis choisissez un schéma. Dans certains cas où la base de données ne contient qu’un seul schéma, celui-ci est choisi automatiquement et l’option de sélection de schémas ne s’affiche pas.

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Choisissez l’une des options suivantes :
   + Préparez les données avant de créer une analyse. Pour ce faire, choisissez **Edit/Preview data (Modifier/Prévisualiser les données)** pour ouvrir la préparation des données pour la table sélectionnée. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et importez les données du jeu de données dans SPICE pour améliorer les performances (recommandé). Pour ce faire, vérifiez la taille de la table et l’indicateur SPICE pour voir si vous avez assez d’espace.

     Si vous avez suffisamment de capacité SPICE, choisissez **Importer vers SPICE pour des analyses plus rapides**, puis créez une analyse en choisissant **Visualiser**.
**Note**  
Si vous souhaitez utiliser SPICE et que vous n’avez pas suffisamment d’espace, choisissez **Modifier/apercevoir des données**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données afin d’en réduire la taille. Vous pouvez également appliquer un filtre ou écrire une requête SQL qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et interrogez les données directement depuis la base de données. Pour ce faire, choisissez l’option **Directly query your data (Interrogation directe de vos données)**. Créez ensuite une analyse en choisissant **Visualize (Visualiser)**.

# Création d’un jeu de données à partir d’une source de données existante
<a name="create-a-data-set-existing"></a>

Après avoir établi une connexion initiale à une Salesforce, à un magasin de AWS données ou à une autre source de données de base de données, Amazon Quick enregistre les informations de connexion. Il ajoute la source de données à la section **FROM EXISTING DATA SOURCES** de la page **Create a Data Set (Créer un jeu de données)**. Vous pouvez utiliser ces sources de données existantes pour créer de nouveaux jeux de données sans spécifier à nouveau les informations de connexion.

## Création d’un jeu de données à partir d’une source de données Amazon S3 existante
<a name="create-a-data-set-existing-s3"></a>

Utilisez la procédure suivante pour créer un jeu de données à l’aide d’une source de données Amazon S3 existante.

**Créer un jeu de données à partir d’une source de données S3 existante**

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez la source de données Amazon S3 à utiliser.

1. Pour préparer les données avant de créer le jeu de données, choisissez **Modifier/apercevoir des données**. Sélectionnez **Visualize (Visualiser)** pour créer une analyse en utilisant les données telles quelles.

## Création d’un jeu de données à partir d’une source de données Amazon Athena existante
<a name="create-a-data-set-existing-athena"></a>

Utilisez la procédure suivante pour créer un jeu de données à l’aide d’une source de données Amazon Athena existante.

**Créer un jeu de données à partir d’un profil de connexion Athena existant**

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

   Choisissez l'icône du profil de connexion correspondant à la source de données existante que vous souhaitez utiliser. Les profils de connexion sont étiquetés avec l’icône de source de données ainsi que le nom fourni par la personne qui a créé la connexion.

1. Choisissez **Create data set**.

   Amazon Quick crée un profil de connexion pour cette source de données basé uniquement sur le groupe de travail Athena. La base de données et le tableau ne sont pas enregistrés. 

1. Dans l’écran **Choisissez votre tableau**, effectuez l’une des opérations suivantes :
   + Pour écrire une requête SQL, choisissez **Utiliser un code SQL personnalisé**.
   + Pour choisir une base de données et un tableau, sélectionnez d’abord votre base de données dans la liste **Bases de données**. Choisissez ensuite un tableau dans la liste qui apparaît pour votre base de données.

## Créer d’un jeu de données à l’aide d’une source de données Salesforce existante
<a name="create-a-data-set-existing-salesforce"></a>

Utilisez la procédure suivante pour créer un jeu de données à l’aide d’une source de données Salesforce existante.

**Créer un jeu de données à l’aide d’une source de données Salesforce existante**

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez la source de données Salesforce à utiliser.

1. Choisissez **Create Data Set**.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tables spécifiques, pour **Éléments de données : contiennent vos données**, choisissez **Sélectionner** puis choisissez **RAPPORT** ou **OBJET**. 

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Sur l’écran suivant, choisissez l’une des options suivantes :
   + Pour créer un jeu de données et une analyse en utilisant les données telles quelles, choisissez **Visualize**.
**Note**  
Si vous n’avez pas suffisamment de capacité [SPICE](spice.md), choisissez **Edit/Preview data**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données pour réduire sa taille ou appliquer un filtre, ce qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données pour le rapport ou l’objet sélectionné. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).

## Création d’un jeu de données à partir d’une source de données de base de données existante
<a name="create-a-data-set-existing-database"></a>

Utilisez la procédure suivante pour créer un jeu de données à l’aide d’une source de données de base de données existante.

**Créer un jeu de données à partir d’une source de données de base de données existante**

1. Sur la page de démarrage rapide d'Amazon, sélectionnez **Data**.

1. Choisissez **Créer**, puis sélectionnez **Nouvel ensemble de données**.

1. Choisissez la source de données de base de données à utiliser, puis choisissez **Create Data Set**.

1. Sélectionnez l’une des méthodes suivantes : 
   + **SQL personnalisé**

     Sur l’écran suivant, vous pouvez choisir d’écrire une requête avec l’option **Use custom SQL (Utiliser un SQL personnalisé)**. Cette opération ouvre un écran nommé **Enter custom SQL query (Entrer une requête SQL personnalisée)**, où vous pouvez taper un nom pour votre requête, puis entrer la requête SQL. Pour obtenir de meilleurs résultats, composez la requête dans un éditeur SQL, puis collez-la dans cette fenêtre. Après avoir nommé et saisi la requête, vous pouvez choisir **Edit/Preview data (Modifier/Prévisualiser les données)** ou **Confirm query (Confirmer la requête)**. Sélectionnez **Edit/Preview data (Modifier/Prévisualiser les données)** pour accéder immédiatement à la préparation des données. Sélectionnez **Confirm query (Confirmer la requête)** pour valider le SQL et s’assurer qu’il n’y a pas d’erreurs.
   + **Choisir des tables**

     Si vous préférez vous connecter à des tableaux spécifiques, pour **Schéma : contient des ensembles de tableaux**, choisissez **Sélectionner**, puis choisissez un schéma. Dans certains cas où la base de données ne contient qu’un seul schéma, celui-ci est choisi automatiquement et l’option de sélection de schémas ne s’affiche pas.

     Pour préparer les données avant de créer une analyse, choisissez **Edit/Preview data** pour ouvrir la préparation des données. Utilisez cette option si vous souhaitez rejoindre plusieurs tables.

     Sinon, après avoir choisi une table, choisissez **Select (Sélectionner)**.

1. Choisissez l’une des options suivantes :
   + Préparez les données avant de créer une analyse. Pour ce faire, choisissez **Edit/Preview data (Modifier/Prévisualiser les données)** pour ouvrir la préparation des données pour la table sélectionnée. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et importez les données du jeu de données dans [SPICE](spice.md) pour améliorer les performances (recommandé). Pour ce faire, vérifiez l’indicateur SPICE pour voir si vous avez assez d’espace.

     Si vous avez suffisamment de capacité SPICE, choisissez **Importer vers SPICE pour des analyses plus rapides**, puis créez une analyse en choisissant **Visualiser**.
**Note**  
Si vous souhaitez utiliser SPICE et que vous n’avez pas suffisamment d’espace, choisissez **Modifier/apercevoir des données**. Lors de la préparation des données, vous pouvez supprimer des champs du jeu de données afin d’en réduire la taille. Vous pouvez également appliquer un filtre ou écrire une requête SQL qui réduit le nombre de lignes ou de colonnes renvoyées. Pour plus d’informations sur la préparation des données, consultez [Exemples de jeux de données préparés](preparing-data-sets.md).
   + Créez un jeu de données et une analyse à l’aide des données de la table telles quelles et interrogez les données directement depuis la base de données. Pour ce faire, choisissez l’option **Directly query your data (Interrogation directe de vos données)**. Créez ensuite une analyse en choisissant **Visualize (Visualiser)**.

# Création d'un ensemble de données à partir d'un ensemble de données existant dans Amazon Quick
<a name="create-a-dataset-existing-dataset"></a>

Après avoir créé un ensemble de données dans Amazon Quick, vous pouvez créer des ensembles de données supplémentaires en l'utilisant comme source. Dans ce cas, toutes les préparations de données contenues dans le jeu de données parent, telles que les jointures ou les champs calculés, sont conservées. Vous pouvez ajouter une préparation supplémentaire aux données des nouveaux jeux de données enfants, par exemple, en joignant de nouvelles données et en filtrant les données. Vous pouvez également configurer votre propre calendrier d’actualisation des données pour le jeu de données enfant et suivre les tableaux de bord ainsi que les analyses qui l’utilisent.

Les jeux de données enfants créés à l’aide d’un jeu de données dont les règles RLS sont actives en tant que source héritent des règles RLS du jeu de données parent. Les utilisateurs qui créent un jeu de données enfant à partir d’un jeu de données parent plus important ne peuvent voir que les données auxquelles ils ont accès dans le jeu de données parent. Vous pouvez ensuite ajouter d’autres règles RLS au nouveau jeu de données enfant, en plus des règles RLS héritées, afin de mieux gérer les personnes autorisées à accéder aux données du nouveau jeu de données. Vous ne pouvez créer des jeux de données enfants qu’à partir de jeux de données dont les règles RLS sont actives dans les requêtes directes.

La création de jeux de données à partir de jeux de données Quick existants présente les avantages suivants :
+ **Gestion centralisée des jeux de données** – Les ingénieurs de données peuvent facilement s’adapter aux besoins de plusieurs équipes au sein de leur organisation. Pour ce faire, ils peuvent développer et gérer quelques jeux de données à usage général qui décrivent les principaux modèles de données de l’organisation.
+ **Réduction de la gestion des sources de données** : les analystes commerciaux (BAs) consacrent souvent beaucoup de temps et d'efforts à demander l'accès aux bases de données, à gérer les informations d'identification des bases de données, à trouver les bonnes tables et à gérer les calendriers d'actualisation rapide des données. La création de nouveaux ensembles de données à partir de jeux de données existants signifie qu'il BAs n'est pas nécessaire de repartir de zéro avec les données brutes des bases de données. Ils peuvent commencer à travailler avec des données sélectionnées.
+ **Indicateurs clés prédéfinis** : En créant des jeux de données à partir de jeux de données existants, les ingénieurs de données peuvent définir et gérer de manière centralisée les définitions des données critiques dans les nombreuses organisations de leur entreprise. La croissance des ventes et le rendement marginal net en sont des exemples. Grâce à cette fonctionnalité, les ingénieurs de données peuvent également distribuer les modifications apportées à ces définitions. Cette approche permet à leurs analystes commerciaux de commencer à visualiser les bonnes données de manière plus rapide et plus fiable.
+ **Flexibilité de personnalisation des données** – En créant des jeux de données à partir de jeux de données existants, les analystes commerciaux bénéficient d’une plus grande flexibilité pour personnaliser les jeux de données en fonction de leurs propres besoins commerciaux. Ainsi, ils ne craignent pas de perturber les données des autres équipes.

Par exemple, supposons que vous faites partie d’une équipe centrale de commerce électronique composée de cinq ingénieurs de données. Grâce à une base de données, vous et votre équipe avez accès aux données relatives aux ventes, aux commandes, aux annulations et aux retours. Vous avez créé un jeu de données rapide en joignant 18 autres tables de dimensions par le biais d'un schéma. Un indicateur clé créé par votre équipe est le champ calculé : ventes de produits commandés (OPS). Sa définition est la suivante : OPS = quantité de produit x prix.

Votre équipe est au service de plus de 100 analystes commerciaux répartis dans 10 équipes différentes dans huit pays. Il s’agit de l’équipe des coupons, de l’équipe du marketing sortant, de l’équipe de la plateforme mobile et de l’équipe des recommandations. Toutes ces équipes utilisent la métrique OPS comme base pour analyser leur propre secteur d’activité.

Plutôt que de créer et de gérer manuellement des centaines de jeux de données non connectés, votre équipe réutilise des jeux de données afin de créer plusieurs niveaux de jeux de données pour les équipes de l’organisation. Cela permet de centraliser la gestion des données et de donner à chaque équipe la capacité de personnaliser les données en fonction de ses propres besoins. Dans le même temps, cela synchronise les mises à jour des données, telles que les mises à jour des définitions des métriques, et assure la sécurité au niveau des lignes et des colonnes. Par exemple, les différentes équipes de votre organisation peuvent utiliser les jeux de données centralisés. Ils peuvent ensuite les combiner avec les données spécifiques à leur équipe pour créer de nouveaux jeux de données et élaborer des analyses à partir de ces derniers.

En plus d’utiliser la métrique OPS clé, les autres équipes de votre organisation peuvent réutiliser les métadonnées des colonnes issues des jeux de données centralisés que vous avez créés. Par exemple, l’équipe d’ingénierie des données peut définir des métadonnées, telles que le *nom*, la *description*, le *type de données* et *les dossiers*, dans un jeu de données centralisé. Toutes les équipes suivantes peuvent également l’utiliser.

**Note**  
Amazon Quick permet de créer jusqu'à deux niveaux supplémentaires d'ensembles de données à partir d'un seul ensemble de données.  
Par exemple, à partir d’un jeu de données parent, vous pouvez créer un jeu de données enfant, puis un jeu de données petit-enfant jusqu’à un total de trois niveaux de jeu de données.

## Création d’un jeu de données à partir d’un jeu de données existant
<a name="create-a-dataset-existing-dataset-how-to"></a>

Utilisez la procédure suivante pour créer un jeu de données à l’aide d’un jeu de données existant.

**Pour créer un jeu de données à partir d’un jeu de données existant**

1. Sur la page de démarrage rapide, choisissez **Data** dans le volet de gauche.

1. Choisissez **Create**, puis choisissez le jeu de données que vous souhaitez utiliser pour créer un nouveau jeu de données.

1. Sur la page qui s’ouvre pour ce jeu de données, choisissez le menu déroulant **Utiliser dans l’analyse**, puis sélectionnez **Utiliser dans le jeu de données**.

   La page de préparation des données s’ouvre et précharge tous les éléments du jeu de données parent, y compris les champs calculés, les jointures et les paramètres de sécurité.

1. Sur la page de préparation des données qui s’ouvre, pour le **mode Requête** en bas à gauche, choisissez la manière dont vous souhaitez que le jeu de données intègre les modifications et les mises à jour du jeu de données parent d’origine. Vous pouvez choisir les options suivantes : 
   + **Requête directe** : il s’agit du mode de requête par défaut. Si vous choisissez cette option, les données de ce jeu de données sont automatiquement actualisées lorsque vous ouvrez un jeu de données, une analyse ou un tableau de bord associé. Cependant, les limites suivantes s’appliquent :
     + Si le jeu de données parent autorise les requêtes directes, vous pourrez utiliser le mode de requête directe dans le jeu de données enfant.
     + Si vous avez plusieurs jeux de données parents dans une jointure, vous pourrez choisir le mode de requête directe pour votre jeu de données enfant uniquement si tous les parents proviennent de la même source de données sous-jacente. Par exemple, la même connexion Amazon Redshift.
     + La requête directe est prise en charge pour un jeu de données SPICE parent unique. Elle n’est pas prise en charge pour plusieurs jeux de données SPICE parents dans une jointure.
   + **SPICE** – Si vous choisissez cette option, vous pourrez définir un calendrier pour la synchronisation de votre nouveau jeu de données avec le jeu de données parent. Pour plus d’informations sur la création de programmes d’actualisation SPICE pour les jeux de données, consultez la rubrique [Actualisation des données SPICE](refreshing-imported-data.md).

1. (Facultatif) Préparez vos données pour analyse. Pour plus d’informations sur la préparation des données, consultez la rubrique [Préparation des données dans Amazon Quick Sight](preparing-data.md).

1. (Facultatif) Configurez la sécurité au niveau des lignes ou des colonnes (RLS/CLS) pour restreindre l’accès au jeu de données. Pour plus d’informations sur la configuration RLS, consultez la rubrique [Utilisation de la sécurité au niveau des lignes (RLS) avec des règles basées sur les utilisateurs pour restreindre l’accès à un jeu de donnéesUtilisation des règles basées sur les utilisateurs](restrict-access-to-a-data-set-using-row-level-security.md). Pour plus d’informations sur la configuration CLS, consultez la rubrique [Utiliser la sécurité au niveau des colonnes pour restreindre l’accès à un jeu de données](restrict-access-to-a-data-set-using-column-level-security.md).
**Note**  
Vous ne pouvez configurer que RLS/CLS des ensembles de données pour enfants. RLS/CLS sur les ensembles de données parents n'est pas pris en charge.

1. Lorsque vous avez terminé, choisissez **Enregistrer et publier** pour enregistrer vos modifications et publier le nouveau jeu de données enfant. Vous pouvez également choisir **Publier et visualiser** pour publier le nouveau jeu de données enfant et commencer à visualiser vos données. 

# Empêcher les autres de créer de nouveaux jeux de données à partir de votre jeu de données
<a name="restrict-create-dataset"></a>

Lorsque vous créez un ensemble de données dans Amazon Quick, vous pouvez empêcher les autres de l'utiliser comme source pour d'autres ensembles de données. Vous pouvez indiquer si d’autres utilisateurs peuvent l’utiliser pour créer des jeux de données. Vous pouvez également spécifier le type de jeux de données que les autres peuvent ou ne peuvent pas créer à partir de votre jeu de données, tels que les jeux de données à requête directe ou les jeux de données SPICE.

Utilisez la procédure suivante pour savoir comment empêcher les autres de créer de nouveaux jeux de données à partir de votre jeu de données.

**Empêcher les autres de créer de nouveaux jeux de données à partir de votre jeu de données**

1. Sur la page de démarrage rapide, choisissez **Data** dans le volet de gauche.

1. Choisissez **Créer**, puis choisissez le jeu de données à partir duquel vous souhaitez limiter la création de nouveaux ensembles de données.

1. Sur la page qui s’ouvre pour ce jeu de données, choisissez **Modifier le jeu de données**.

1. Sur la page de préparation des données qui s’ouvre, choisissez **Gérer** en haut à droite, puis **Propriétés**.

1. Dans le volet **Propriétés du jeu de données** qui s’ouvre, choisissez l’une des options suivantes :
   + Pour empêcher quiconque de créer tout type de nouveau jeu de données à partir de ce jeu de données, désactivez **Autoriser la création de nouveaux jeux de données à partir de celui-ci**.

     Lorsque la création de nouveaux jeux de données est autorisée, le bouton est bleu. Ce dernier devient gris lorsque la création de nouveaux jeux de données n’est pas autorisée.
   + Pour empêcher les autres utilisateurs de créer des jeux de données de requêtes directes, désactivez **Autoriser les requêtes directes**.
   + Pour empêcher les autres utilisateurs de créer des copies SPICE de votre jeu de données, désactivez **Autoriser les copies SPICE**.

     Pour plus d’informations sur les jeux de données SPICE, consultez la rubrique [Importation de données dans SPICE](spice.md).

1. Fermez la fenêtre.