

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Expérience de préparation des données (nouvelle)
<a name="data-prep-experience-new"></a>

La préparation des données transforme les données brutes en un format optimisé pour l'analyse et la visualisation. Dans le domaine de l'informatique décisionnelle, ce processus crucial implique le nettoyage, la structuration et l'enrichissement des données pour obtenir des informations commerciales pertinentes.

L'interface de préparation des données d'Amazon Quick Sight révolutionne ce processus grâce à une expérience visuelle intuitive qui permet aux utilisateurs de créer des ensembles de données prêts à être analysés sans aucune expertise SQL. Grâce à son approche moderne et rationalisée, les utilisateurs peuvent créer et gérer efficacement des ensembles de données de business intelligence. L'interface visuelle présente une vue claire et séquentielle des transformations des données, permettant aux auteurs de suivre avec précision les modifications entre l'état initial et le résultat final.

La plateforme met l'accent sur la collaboration et la réutilisabilité, permettant aux équipes de partager et de réutiliser les flux de travail au sein de l'organisation. Cette conception collaborative favorise la cohérence des pratiques de transformation des données tout en éliminant le travail redondant, favorisant ainsi la standardisation des processus au sein des équipes et améliorant l'efficacité globale.

**Topics**
+ [Composantes de l'expérience de préparation des données](data-prep-components.md)
+ [Étapes de préparation des données](data-prep-steps.md)
+ [Fonctionnalités de flux de travail avancées](advanced-workflow-capabilities.md)
+ [Fonctionnalités réservées aux épices](spice-only-features.md)
+ [Passer d'une expérience de préparation des données à une autre](switching-between-data-prep-experiences.md)
+ [Fonctionnalités non prises en charge dans la nouvelle expérience de préparation des données](unsupported-features.md)
+ [Limites de préparation des données](data-preparation-limits.md)
+ [Changements du comportement d'ingestion](ingestion-behavior-changes.md)
+ [Questions fréquentes (FAQ)](new-data-prep-faqs.md)

# Composantes de l'expérience de préparation des données
<a name="data-prep-components"></a>

L'expérience d'Amazon Quick Sight en matière de préparation des données repose sur les éléments essentiels suivants.

## Flux de travail
<a name="workflow-component"></a>

Dans l'expérience de préparation des données de Quick Sight, un flux de travail représente une série séquentielle d'étapes de transformation des données qui guident votre ensemble de données de son état brut à un formulaire prêt à être analysé. Ces flux de travail sont conçus pour être réutilisables, permettant aux analystes de tirer parti du travail existant et de le développer tout en maintenant des normes de transformation des données cohérentes dans l'ensemble de l'organisation.

Bien que les flux de travail puissent s'adapter à plusieurs chemins par le biais de différentes entrées ou de divergences (détaillées dans les sections suivantes), ils doivent finalement converger en une seule table de sortie. Cette structure unifiée garantit la cohérence des données et rationalise les capacités d'analyse.

## Transformation
<a name="transformation-component"></a>

Une transformation est une opération de manipulation de données spécifique qui modifie la structure, le format ou le contenu de vos données. L'expérience de préparation des données de Quick Sight propose différents types de transformation, notamment Join, Filter, Aggregate, Pivot, Unpivot, Ajouter et Calculated Columns. Chaque type de transformation a un objectif distinct en remodelant vos données afin de répondre aux exigences analytiques. Ces transformations sont mises en œuvre en tant qu'étapes individuelles au sein de votre flux de travail.

## Step (Étape)
<a name="step-component"></a>

Une étape est un ensemble de transformations homogènes du même type appliquées dans votre flux de travail. Chaque étape contient une ou plusieurs opérations connexes de la même catégorie de transformation. Par exemple, une étape de renommage peut inclure plusieurs opérations de renommage de colonnes, et une étape de filtrage peut contenir plusieurs conditions de filtrage, toutes gérées comme une seule unité dans votre flux de travail.

La plupart des étapes peuvent inclure plusieurs opérations, à deux exceptions près : les étapes Joindre et Ajouter sont limitées à deux tables d'entrée par étape. Pour joindre ou ajouter plus de deux tables, vous pouvez créer des étapes de jointure ou d'ajout supplémentaires en séquence.

Les étapes sont affichées dans l'ordre, chaque étape s'appuyant sur les résultats des étapes précédentes, ce qui vous permet de suivre la transformation progressive de vos données. Pour renommer ou supprimer une étape, sélectionnez-la et choisissez le menu à trois points.

## Connecteur
<a name="connector-component"></a>

Le connecteur relie deux étapes par une flèche indiquant le sens du flux de travail. Vous pouvez supprimer un connecteur en le sélectionnant et en appuyant sur la touche Supprimer. Pour ajouter une étape entre deux étapes existantes, il suffit de supprimer le connecteur, d'ajouter la nouvelle étape et de reconnecter les étapes en faisant glisser votre souris entre elles.

## Panneau de configuration
<a name="configure-pane-component"></a>

Le **volet Configuration** est la zone interactive dans laquelle vous définissez les paramètres et les paramètres d'une étape sélectionnée. Lorsque vous sélectionnez une étape de votre flux de travail, ce volet affiche les options pertinentes pour ce type de transformation spécifique. Par exemple, lors de la configuration d'une étape de jointure, vous pouvez sélectionner le type de jointure, les colonnes correspondantes et d'autres paramètres spécifiques à la jointure. L' point-and-clickinterface du **volet Configuration** élimine le besoin de connaissances SQL.

## Volet d'aperçu
<a name="preview-pane-component"></a>

Le **volet d'aperçu** affiche un échantillon en temps réel de vos données telles qu'elles apparaissent après l'application de l'étape de transformation en cours. Ce feedback visuel immédiat vous permet de vérifier que chaque transformation produit les résultats escomptés avant de passer à l'étape suivante. Le **volet d'aperçu** est mis à jour de manière dynamique lorsque vous modifiez les configurations des étapes, ce qui permet d'affiner de manière itérative les transformations de données en toute confiance.

Ces composants fonctionnent ensemble pour créer une expérience visuelle intuitive de préparation des données qui rend les transformations de données complexes accessibles aux utilisateurs professionnels sans nécessiter d'expertise technique.

# Étapes de préparation des données
<a name="data-prep-steps"></a>

L'expérience de préparation des données d'Amazon Quick Sight propose onze types d'étapes puissants qui vous permettent de transformer systématiquement vos données. Chaque étape a un objectif spécifique dans le flux de travail de préparation des données.

Les étapes peuvent être configurées via une interface intuitive dans le volet de **configuration**, avec un retour immédiat visible dans le volet d'**aperçu**. Les étapes peuvent être combinées de manière séquentielle pour créer des transformations de données sophistiquées sans nécessiter d'expertise SQL.

Chaque étape peut recevoir l'entrée d'une table physique ou la sortie d'une étape précédente. La plupart des étapes n'acceptent qu'une seule entrée, les étapes Ajouter et Joindre étant des exceptions : elles nécessitent exactement deux entrées.

## Input
<a name="input-step"></a>

L'étape de saisie lance votre flux de travail de préparation des données dans Quick Sight en vous permettant de sélectionner et d'importer des données provenant de plusieurs sources pour les transformer lors des étapes suivantes.

**Options de saisie**
+ **Ajouter un ensemble de données**

  Tirez parti des ensembles de données Quick Sight existants comme sources d'entrée, en vous appuyant sur des données déjà préparées et optimisées par votre équipe.
+ **Ajouter une source de données**

  Connectez-vous directement à des bases de données telles qu'Amazon Redshift, Athena, RDS ou à d'autres sources prises en charge en sélectionnant des objets de base de données spécifiques et en fournissant des paramètres de connexion.
+ **Ajouter un téléchargement de fichier**

  Importez des données directement à partir de fichiers locaux dans des formats tels que CSV, TSV, Excel ou JSON.

**Configuration**

L'étape de saisie ne nécessite aucune configuration. Le volet d'**aperçu** affiche vos données importées ainsi que les informations sur la source, notamment les détails de connexion, le nom de la table et les métadonnées des colonnes.

**Notes d’utilisation**
+ Plusieurs étapes de saisie peuvent exister au sein d'un même flux de travail.
+ Vous pouvez ajouter des étapes de saisie à tout moment dans votre flux de travail.

## Ajouter des colonnes calculées
<a name="add-calculated-columns-step"></a>

L'étape Ajouter des colonnes calculées vous permet de créer de nouvelles colonnes à l'aide d'expressions au niveau des lignes qui effectuent des calculs sur des colonnes existantes. Vous pouvez créer de nouvelles colonnes à l'aide de fonctions et d'opérateurs scalaires (au niveau des lignes) et appliquer des calculs au niveau des lignes qui font référence à des colonnes existantes.

**Configuration**

Pour configurer l'étape Ajouter des colonnes calculées, dans le volet **Configuration** :

1. Donnez un nom à votre nouvelle colonne calculée.

1. [Créez des expressions à l'aide de l'éditeur de calcul, qui prend en charge les fonctions et les opérateurs au niveau des lignes (tels que [ifelse](ifelse-function.md) et round).](round-function.md)

1. Enregistrez votre calcul.

1. Prévisualisez les résultats de l'expression.

1. Ajoutez d'autres colonnes calculées selon vos besoins.

**Notes d’utilisation**
+ Seuls les calculs scalaires (au niveau des lignes) sont pris en charge dans cette étape.
+ Dans SPICE, les colonnes calculées sont matérialisées et fonctionnent comme des colonnes standard dans les étapes suivantes.

## Modifier le type de données
<a name="change-data-type-step"></a>

Quick Sight simplifie la gestion des types de données en prenant en charge quatre types de données abstraits : `date` `decimal``integer`,, et`string`. Ces types abstraits éliminent la complexité en mappant automatiquement les différents types de données sources à leurs équivalents Quick Sight. Par exemple,`tinyint`, `smallint``integer`, et `bigint` sont tous mappés vers`integer`, tandis que, `date``datetime`, et `timestamp` sont mappés vers. `date`

Cette abstraction signifie qu'il vous suffit de comprendre les quatre types de données de Quick Sight, car Quick Sight gère automatiquement toutes les conversions de types de données sous-jacents et les calculs lorsque vous interagissez avec différentes sources de données.

**Configuration**

Pour configurer l'étape Modifier le type de données, dans le volet **Configuration** :

1. Sélectionnez une colonne à convertir.

1. Choisissez le type de données cible (`string``integer`,`decimal`, ou`date`).

1. Pour les conversions de dates, spécifiez les paramètres de format et prévisualisez les résultats en fonction des formats d'entrée. Consultez les [formats de date pris en charge](supported-data-types-and-values.md) dans Quick Sight.

1. Ajoutez des colonnes supplémentaires à convertir selon vos besoins.

**Notes d’utilisation**
+ Convertissez les types de données de plusieurs colonnes en une seule étape pour plus d'efficacité.
+ Lorsque vous utilisez SPICE, tous les changements de type de données sont matérialisés dans les données importées.

## Renommer les colonnes
<a name="rename-columns-step"></a>

L'étape Renommer les colonnes vous permet de modifier les noms des colonnes afin qu'ils soient plus descriptifs, faciles à utiliser et conformes aux conventions de dénomination de votre organisation.

**Configuration**

Pour configurer l'étape Renommer les colonnes, dans le volet **Configuration** :

1. Sélectionnez une colonne à nommer.

1. Entrez un nouveau nom pour la colonne sélectionnée.

1. Ajoutez d'autres colonnes à renommer selon vos besoins.

**Notes d’utilisation**
+ Tous les noms de colonnes doivent être uniques dans votre ensemble de données.

## Sélectionnez les colonnes
<a name="select-columns-step"></a>

L'étape Sélectionner les colonnes vous permet de rationaliser votre jeu de données en incluant, en excluant et en réorganisant les colonnes. Cela permet d'optimiser votre structure de données en supprimant les colonnes inutiles et en organisant les colonnes restantes dans un ordre logique à des fins d'analyse.

**Configuration**

Pour configurer l'étape Sélectionner les colonnes, dans le volet **Configuration** :

1. Choisissez des colonnes spécifiques à inclure dans votre sortie.

1. Sélectionnez les colonnes dans l'ordre de votre choix pour établir la séquence.

1. Utilisez **Sélectionner tout** pour inclure les colonnes restantes dans leur ordre d'origine.

1. Excluez les colonnes indésirables en les laissant non sélectionnées.

**Caractéristiques principales**
+ Les colonnes de sortie apparaissent dans l'ordre de sélection.
+ **Tout sélectionner** préserve la séquence de colonnes d'origine.

**Notes d’utilisation**
+ Les colonnes non sélectionnées sont supprimées des étapes suivantes.
+ Optimisez la taille du jeu de données en supprimant les colonnes inutiles.

## Ajout
<a name="append-step"></a>

L'étape Ajouter combine verticalement deux tables, comme dans le cas d'une opération SQL UNION ALL. Quick Sight fait automatiquement correspondre les colonnes par nom plutôt que par séquence, ce qui permet une consolidation efficace des données, même lorsque les tables ont des ordres de colonnes différents ou un nombre variable de colonnes.

**Configuration**

Pour configurer l'étape Ajouter, dans le volet **Configuration** :

1. Sélectionnez deux tables d'entrée à ajouter.

1. Passez en revue la séquence des colonnes de sortie.

1. Examinez les colonnes présentes dans les deux tables par rapport aux colonnes présentes dans les tables individuelles.

**Fonctions principales**
+ Fait correspondre les colonnes par nom plutôt que par séquence.
+ Conserve toutes les lignes des deux tables, y compris les doublons.
+ Supporte les tables avec différents nombres de colonnes.
+ Suit la séquence de colonnes du tableau 1 pour les colonnes correspondantes, puis ajoute des colonnes uniques à partir du tableau 2.
+ Affiche des indicateurs de source clairs pour toutes les colonnes

**Notes d’utilisation**
+ Utilisez d'abord l'étape Renommer lorsque vous ajoutez des colonnes portant des noms différents.
+ Chaque étape d'ajout combine exactement deux tables ; utilisez des étapes d'ajout supplémentaires pour d'autres tables.

## Joindre
<a name="join-step"></a>

L'étape Joindre combine horizontalement les données de deux tables en fonction des valeurs correspondantes dans des colonnes spécifiées. Quick Sight prend en charge les types de jointure externe gauche, externe droite, externe complète et interne, offrant ainsi des options flexibles pour vos besoins analytiques. Cette étape inclut la résolution intelligente des conflits de colonnes qui gère automatiquement les noms de colonnes dupliqués. Bien que les jointures automatiques ne soient pas disponibles en tant que type de jointure spécifique, vous pouvez obtenir des résultats similaires en utilisant la divergence des flux de travail.

**Configuration**

Pour configurer l'étape Joindre, dans le volet **Configuration** :

1. Sélectionnez deux tables d'entrée à joindre.

1. Choisissez votre type de jointure (extérieur gauche, extérieur droit, extérieur complet ou intérieur).

1. Spécifiez les clés de jointure de chaque table.

1. Vérifiez les conflits de noms de colonnes résolus automatiquement.

**Fonctions principales**
+ Prend en charge plusieurs types de jointure pour différents besoins analytiques.
+ Résout automatiquement les noms de colonnes dupliqués.
+ Accepte les colonnes calculées comme clés de jointure.

**Notes d’utilisation**
+ Les clés de jointure doivent avoir des types de données compatibles ; utilisez l'étape Modifier le type de données si nécessaire.
+ Chaque étape de jointure combine exactement deux tables ; utilisez des étapes de jointure supplémentaires pour plus de tables.
+ Créez une étape de renommage après la jointure pour personnaliser les en-têtes de colonne résolus automatiquement.

## Regrouper
<a name="aggregate-step"></a>

L'étape Agrégation vous permet de synthétiser les données en groupant les colonnes et en appliquant des opérations d'agrégation. Cette puissante transformation condense les données détaillées en résumés significatifs basés sur les dimensions que vous avez spécifiées. Quick Sight simplifie les opérations SQL complexes grâce à une interface intuitive, offrant des fonctions d'agrégation complètes, notamment des opérations de chaîne avancées telles que `ListAgg` et`ListAgg distinct`.

**Configuration**

Pour configurer l'étape d'agrégation, dans le volet **Configuration** :

1. Sélectionnez les colonnes à regrouper.

1. Choisissez des fonctions d'agrégation pour les colonnes de mesure.

1. Personnalisez les noms des colonnes de sortie.

1. Pour `ListAgg` et `ListAgg distinct` :

   1. Sélectionnez la colonne à agréger.

   1. Choisissez un séparateur (virgule, tiret, point-virgule ou ligne verticale).

1. Prévisualisez les données résumées.

**Fonctions prises en charge par type de données**


| Type de données | Fonctions prises en charge | 
| --- | --- | 
|  Numérique  |  `Average`, `Sum` `Count`, `Count Distinct` `Max`, `Min`  | 
|  Date  |  `Count`, `Count Distinct` `Max`, `Min` `ListAgg`, `ListAgg distinct` (pour la date uniquement)  | 
|  String  |  `ListAgg`, `ListAgg distinct` `Count`, `Count Distinct` `Max`, `Min`  | 

**Fonctions principales**
+ Applique différentes fonctions d'agrégation aux colonnes au cours de la même étape.
+ **Grouper par** sans fonctions d'agrégation agit comme SQL SELECT DISTINCT.
+ `ListAgg`concatène toutes les valeurs ; `ListAgg distinct` inclut uniquement les valeurs uniques.
+ `ListAgg`les fonctions conservent l'ordre de tri croissant par défaut.

**Notes d’utilisation**
+ L'agrégation réduit considérablement le nombre de lignes dans votre ensemble de données.
+ `ListAgg`et `ListAgg distinct` soutiennent `date` les valeurs, mais non`datetime`.
+ Utilisez des séparateurs pour personnaliser le résultat de la concaténation de chaînes.

## Filtre
<a name="filter-step"></a>

L'étape Filtrer vous permet d'affiner votre jeu de données en n'incluant que les lignes répondant à des critères spécifiques. Vous pouvez appliquer plusieurs conditions de filtre en une seule étape, en les combinant de `AND` manière logique afin de concentrer votre analyse sur les données pertinentes.

**Configuration**

Pour configurer l'étape Filtrer, dans le volet **Configuration** :

1. Sélectionnez une colonne à filtrer.

1. Choisissez un opérateur de comparaison.

1. Spécifiez les valeurs de filtre en fonction du type de données de la colonne.

1. Ajoutez des conditions de filtre supplémentaires sur différentes colonnes si nécessaire.

**Note**  
Filtres de chaîne avec « est dedans » ou « n'est pas dedans » : entrez plusieurs valeurs (une par ligne).
Filtres numériques et de date : entrez des valeurs uniques (sauf « entre » qui nécessite deux valeurs).

**Opérateurs pris en charge par type de données**


| Type de données | Opérateurs pris en charge | 
| --- | --- | 
|  Nombre entier et décimal  |  Est égal, n'est pas égal Supérieur à, Inférieur à Est supérieur ou égal à, Est inférieur ou égal à Est comprise entre  | 
|  Date  |  Avant, après Est comprise entre Est après ou égal à, Est antérieur ou égal à  | 
|  String  |  Est égal, n'est pas égal Commence par, se termine par Contient, Ne contient pas Est dedans, n'est pas dedans  | 

**Notes d’utilisation**
+ Appliquez plusieurs conditions de filtre en une seule étape.
+ Mélangez les conditions entre différents types de données.
+ Prévisualisez les résultats filtrés en temps réel.

## Pivot
<a name="pivot-step"></a>

L'étape Pivot transforme les valeurs des lignes en colonnes uniques, convertissant les données d'un format long en un format large pour faciliter la comparaison et l'analyse. Cette transformation nécessite des spécifications pour le filtrage, l'agrégation et le regroupement des valeurs afin de gérer efficacement les colonnes de sortie.

**Configuration**

Pour configurer l'étape Pivot, utilisez ce qui suit dans le volet **Configuration** :

1. **Colonne pivotante** : sélectionnez la colonne dont les valeurs deviendront des en-têtes de colonne (par exemple, Catégorie).

1. **Valeur de la ligne de colonne pivotante** : filtrez les valeurs spécifiques à inclure (par exemple, technologie, fournitures de bureau).

1. **En-tête de colonne de sortie** : personnalisez les nouveaux en-têtes de colonne (par défaut, les valeurs des colonnes pivotent).

1. **Colonne de valeurs** : sélectionnez la colonne à agréger (par exemple, Ventes).

1. **Fonction d'agrégation** : choisissez la méthode d'agrégation (par exemple, Sum).

1. **Regrouper par** : Spécifiez les colonnes d'organisation (par exemple, Segment).

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/images/pivot.png)


**Opérateurs pris en charge par type de données**


| Type de données | Opérateurs pris en charge | 
| --- | --- | 
|  Nombre entier et décimal  |  `Average`, `Sum` `Count`, `Count Distinct` `Max`, `Min`  | 
|  Date  |  `Count`, `Count Distinct` `Max`, `Min` `ListAgg`, `ListAgg distinct` (valeurs de date uniquement)  | 
|  String  |  `ListAgg`, `ListAgg distinct` `Count`, `Count Distinct` `Max`, `Min`  | 

**Notes d’utilisation**
+ Chaque colonne pivotée contient les valeurs agrégées de la colonne de valeurs.
+ Personnalisez les en-têtes de colonne pour plus de clarté.
+ Prévisualisez les résultats de transformation en temps réel.

## Dépivoter
<a name="unpivot-step"></a>

L'étape Unpivot transforme les colonnes en lignes, convertissant les données larges en un format plus long et plus étroit. Cette transformation permet d'organiser les données réparties sur plusieurs colonnes dans un format plus structuré pour faciliter l'analyse et la visualisation.

**Configuration**

Pour configurer l'étape Unpivot, dans le volet **Configuration** :

1. Sélectionnez les colonnes à dépivoter en lignes.

1. Définissez les valeurs des lignes des colonnes de sortie. Le nom de colonne par défaut est le nom d'origine. Certains exemples incluent la technologie, les fournitures de bureau et le mobilier.

1. Nommez les deux nouvelles colonnes de sorties.
   + **En-tête de colonne non pivotant** : nom des anciens noms de colonne (par exemple, Catégorie)
   + Valeurs de **colonne non pivotées : nom des valeurs** non pivotées (par exemple, Sales)

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/images/unpivot.png)


**Fonctions principales**
+ Conserve toutes les colonnes non pivotantes de la sortie.
+ Crée automatiquement deux nouvelles colonnes : une pour les anciens noms de colonne et une pour les valeurs correspondantes.
+ Transforme des données étendues en format long.

**Notes d’utilisation**
+ Toutes les colonnes non pivotantes doivent avoir des types de données compatibles.
+ Le nombre de lignes augmente généralement après le dépivotement.
+ Prévisualisez les modifications en temps réel avant de les appliquer.

# Fonctionnalités de flux de travail avancées
<a name="advanced-workflow-capabilities"></a>

L'expérience de préparation des données d'Amazon Quick Sight propose des fonctionnalités sophistiquées qui améliorent votre capacité à créer des transformations de données complexes et réutilisables. Cette section couvre deux fonctionnalités puissantes qui étendent le potentiel de votre flux de travail.

La divergence vous permet de créer plusieurs chemins de transformation à partir d'une seule étape, ce qui permet des flux de traitement parallèles qui peuvent être recombinés ultérieurement. Cette fonctionnalité est particulièrement utile pour les scénarios complexes tels que les jointures automatiques et les transformations parallèles.

Les ensembles de données composites vous permettent de créer des structures de données hiérarchiques en utilisant des ensembles de données existants comme éléments de base. Cette fonctionnalité favorise la collaboration entre les équipes et garantit une logique métier cohérente grâce à des transformations en couches réutilisables.

Ces fonctionnalités fonctionnent ensemble pour fournir des conceptions de flux de travail flexibles, une collaboration d'équipe améliorée et des transformations de données réutilisables. Ils garantissent un lignage clair des données et permettent des solutions de préparation des données évolutives, permettant à votre organisation de gérer des scénarios de données de plus en plus complexes avec efficacité et clarté.

## Divergence
<a name="divergence"></a>

La divergence vous permet de créer plusieurs chemins de transformation parallèles à partir d'une seule étape de votre flux de travail. Ces chemins peuvent être transformés indépendamment puis recombinés, ce qui permet des scénarios complexes de préparation des données tels que les auto-jointures.

**Création de chemins divergents**

Pour initier une divergence, dans votre flux de travail :

1. Sélectionnez l'étape dans laquelle vous souhaitez créer une divergence.

1. Cliquez sur l'icône **\$1** qui apparaît.

1. Configurez la nouvelle branche qui apparaît.

1. Appliquez les transformations souhaitées à chaque tracé.

1. Utilisez les étapes Joindre ou Ajouter pour recombiner les chemins en une seule sortie.

![\[alt text not found\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/images/divergence.png)


**Fonctions principales**
+ Crée jusqu'à cinq chemins divergents à partir d'une seule étape.
+ Applique des transformations différentes à chaque tracé.
+ Recombine les chemins à l'aide des étapes Joindre ou Ajouter.
+ Prévisualise les modifications apportées à chaque trajectoire indépendamment.

**Bonnes pratiques**
+ Utilisez la divergence pour implémenter les jointures automatiques.
+ Créez des copies de données pour les transformations parallèles.
+ Planifiez votre stratégie de recombinaison (joindre ou ajouter).
+ Conservez un nom de chemin clair pour une meilleure visibilité du flux de travail.

## Ensembles de données composites
<a name="composite-datasets"></a>

Les ensembles de données composites vous permettent de vous appuyer sur des ensembles de données existants pour créer des structures de transformation de données hiérarchiques qui peuvent être partagées et réutilisées au sein de votre organisation. Quick Sight prend en charge jusqu'à 10 niveaux de jeux de données composites dans les modes SPICE et Direct Query.

**Création d'un jeu de données composite**

Pour créer un jeu de données composite, dans votre flux de travail :

1. Sélectionnez l'étape Entrée lors de la création d'un nouvel ensemble de données.

1. Choisissez **Dataset** comme source sous **Ajouter des données**.

1. Sélectionnez un jeu de données existant sur lequel vous souhaitez vous appuyer.

1. Appliquez des transformations supplémentaires si nécessaire.

1. Enregistrez en tant que nouvel ensemble de données.

**Fonctions principales**
+ Construit des structures hiérarchiques de transformation des données.
+ Supporte jusqu'à 10 niveaux d'imbrication de jeux de données.
+ Compatible avec SPICE et Direct Query.
+ Maintient un lignage clair des données.
+ Permet des transformations spécifiques à l'équipe.

Cette fonctionnalité améliore la collaboration entre les différentes équipes. Par exemple, 


| Role | Action | Output | 
| --- | --- | --- | 
|  Analyste mondial  |  Crée un ensemble de données avec une logique métier globale  |  Ensemble de données A  | 
|  Analyste des Amériques  |  Utilise le jeu de données A, ajoute une logique régionale  |  Ensemble de données B  | 
|  Analyste de l'ouest des États-Unis  |  Utilise le jeu de données B, ajoute une logique locale  |  Ensemble de données C  | 

Cette approche hiérarchique favorise une logique métier cohérente au sein de votre organisation en attribuant clairement la propriété des couches de transformation. Il crée un lignage de données traçable tout en prenant en charge jusqu'à 10 niveaux d'imbrication de jeux de données, permettant ainsi une gestion contrôlée et systématique de la transformation des données.

**Bonnes pratiques**
+ Définissez clairement la propriété de chaque couche de transformation.
+ Documentez les relations et les dépendances des jeux de données.
+ Planifiez la profondeur de la hiérarchie en fonction des besoins de l'entreprise.
+ Maintenez des conventions de dénomination cohérentes.
+ Passez en revue et mettez à jour les ensembles de données en amont avec soin.

# Fonctionnalités réservées aux épices
<a name="spice-only-features"></a>

Le moteur de calcul SPICE (moteur de calcul parallèle ultrarapide en mémoire) d'Amazon Quick Sight permet certaines fonctionnalités de préparation des données nécessitant des calculs intensifs. Ces transformations sont matérialisées dans SPICE pour des performances optimales, plutôt que d'être exécutées au moment de la requête.

**Fonctionnalités réservées aux épices**


| Étapes | Autres capacités | 
| --- | --- | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/spice-only-features.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/spice-only-features.html)  | 

**Fonctionnalités disponibles à la fois dans SPICE et DirectQuery**


| Étapes | Autres capacités | 
| --- | --- | 
|  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/spice-only-features.html)  |  [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/fr_fr/quick/latest/userguide/spice-only-features.html)  | 

**Bonnes pratiques**
+ Utilisez SPICE pour les flux de travail nécessitant des fonctionnalités uniquement SPICE.
+ Choisissez SPICE pour optimiser les performances pour les transformations complexes et les grands ensembles de données.
+ Tenez compte DirectQuery des besoins en matière de données en temps réel lorsque les fonctionnalités uniquement de SPICE ne sont pas requises.

# Passer d'une expérience de préparation des données à une autre
<a name="switching-between-data-prep-experiences"></a>

L'ancienne expérience de préparation des données fait référence à l'ancienne interface de préparation des données d'Amazon Quick Sight qui existait avant octobre 2025. La nouvelle expérience de préparation des données est l'interface visuelle améliorée qui montre les séquences de step-by-step transformation. Les anciens ensembles de données sont ceux créés avant la nouvelle expérience de préparation des données, tandis que les nouveaux ensembles de données sont ceux créés après octobre 2025.

Lorsque vous créez un nouvel ensemble de données, Quick Sight vous dirige automatiquement vers la nouvelle expérience de préparation des données. Cette interface visuelle offre des fonctionnalités améliorées et une meilleure facilité d'utilisation pour les tâches de transformation des données.

## Option de désinscription
<a name="opt-out"></a>

Avant d'enregistrer et de publier un jeu de données, vous avez la possibilité de revenir à l'ancienne expérience de préparation des données, si vous le souhaitez. Cette flexibilité permet aux équipes de faire la transition à leur propre rythme tout en se familiarisant avec la nouvelle interface.

**Important**  
Si un ensemble de données est enregistré et publié dans la nouvelle expérience, il n'est pas possible de revenir à l'ancienne expérience. Cela est intentionnel, car la nouvelle expérience comporte de nouvelles fonctionnalités importantes qui ne sont pas prises en charge dans l'ancienne expérience. Par conséquent, la conversion directe d'ensembles de données d'une expérience à une autre n'est pas prise en charge. Vous devrez créer un nouveau jeu de données pour passer à l'ancienne expérience.

## Flux de travail de transition
<a name="transition-workflow"></a>

Une fois qu'un jeu de données est enregistré dans la nouvelle expérience ou dans l'ancienne expérience, les transformations ne peuvent pas être directement converties d'une expérience à l'autre. Toutefois, s'il existe une version de jeu de données publiée, vous pouvez utiliser le contrôle de version pour accéder à la version précédente, qui se trouve peut-être dans l'ancienne expérience.

Les anciens ensembles de données continueront d'être accessibles pour consultation et modification exclusivement via l'ancienne interface. Cela permet de maintenir la compatibilité avec les flux de travail établis précédemment.

Avant de procéder à une transition complète, prenez le temps de vous familiariser avec la nouvelle expérience de préparation des données. Lorsque vous travaillez avec des ensembles de données existants, pensez à créer une nouvelle version en utilisant la nouvelle expérience pour les modifications futures. Utilisez le contrôle de version pour conserver l'accès aux anciennes versions des ensembles de données si nécessaire. Documentez toute modification du flux de travail lors de la transition d'une ancienne expérience à une nouvelle afin de garantir l'alignement de l'équipe.

# Fonctionnalités non prises en charge dans la nouvelle expérience de préparation des données
<a name="unsupported-features"></a>

Bien que la nouvelle expérience de préparation des données offre des fonctionnalités améliorées, certaines fonctionnalités de l'ancienne expérience ne sont pas encore prises en charge. Cette section décrit ces fonctionnalités et fournit des conseils pour gérer les flux de travail concernés.

Lorsque vous utilisez des sources de données non prises en charge, Amazon Quick Sight utilise automatiquement par défaut l'ancienne expérience. Pour les autres fonctionnalités non prises en charge, sélectionnez **Passer à l'ancienne expérience** dans le coin supérieur droit de la page de préparation des données. Règles Les ensembles de données créés dans l'ancienne expérience restent compatibles avec les ensembles de données d'expérience existants et nouveaux.

## Sources de données non prises en charge
<a name="unsupported-data-sources"></a>

Les sources de données suivantes ne sont actuellement disponibles que dans l'ancienne expérience.


| Source de données | Détails | 
| --- | --- | 
|  Salesforce  |  Bascule automatiquement par défaut sur l'ancienne expérience  | 
|  Google Sheets  |  Bascule automatiquement par défaut sur l'ancienne expérience  | 
|  Analyses S3  |  **Les sources de données S3 sont prises en charge**  | 

## Autres fonctionnalités non prises en charge
<a name="other-unsupported-features"></a>

Les fonctionnalités suivantes ne sont actuellement disponibles que dans l'ancienne expérience.


| Catégorie de fonctionnalités | Fonctions non prises en charge | 
| --- | --- | 
|  Gestion des jeux de données  |  [Actualisation incrémentielle](refreshing-imported-data.md#refresh-spice-data-incremental), [paramètres du jeu de données](dataset-parameters.md), [dossiers de colonnes](organizing-fields-folder.md), descriptions de [colonnes](describing-data.md)  | 
|  Les types de données  |  [Géospatial](geospatial-data-prep.md)[, [formats ELF/CLF](supported-data-sources.md#file-data-sources), fichiers Zip/ dans S3 GZip ](supported-data-sources.md#file-data-sources)  | 
|  Options de configuration  |  [« Commencer par la ligne » dans les paramètres de téléchargement de fichiers](choosing-file-upload-settings.md), format de date JODA  | 
|  Sélection du jeu de données parent à partir de l'expérience existante  |  Les ensembles de données parent et enfant doivent exister dans le même environnement d'expérience. Vous ne pouvez pas utiliser un ancien jeu de données d'expérience en tant que parent d'un nouveau jeu de données d'expérience.  | 

## Développement futur
<a name="future-development"></a>

Amazon Quick Sight prévoit d'implémenter ces fonctionnalités dans la nouvelle expérience de préparation des données à l'avenir. Cette approche garantit que le lancement initial de la nouvelle expérience de préparation des données donne la priorité aux éléments suivants :

**Capacités améliorées**
+ Workflows de transformation visuelle
+ Transparence des processus améliorée
+ Techniques de préparation avancées grâce à Divergence
+ De nouvelles fonctionnalités puissantes telles que Append, Aggregate et Pivot

**Adoption flexible**

Les utilisateurs peuvent choisir entre différentes expériences avant de publier des ensembles de données, ce qui garantit des flux de travail ininterrompus pendant que les équipes effectuent la transition à leur propre rythme. Cette approche permet un accès immédiat aux nouvelles fonctionnalités tout en maintenant la prise en charge des exigences spécialisées grâce à l'expérience existante.

# Limites de préparation des données
<a name="data-preparation-limits"></a>

L'expérience de préparation des données d'Amazon Quick Sight est conçue pour gérer des ensembles de données à l'échelle de l'entreprise tout en maintenant des performances optimales. Les limites suivantes garantissent une fonctionnalité fiable.

## Limites de taille des jeux de données (SPICE)
<a name="dataset-size-limits"></a>
+ **Taille de sortie** : jusqu'à 2 To ou 2 milliards de lignes
+ **Taille d'entrée totale** : les sources d'entrée combinées ne peuvent pas dépasser 2 To
+ **Taille des tables secondaires** : la taille combinée est limitée à 20 Go

**Note**  
Les tables principales sont celles dont la taille est maximale dans un flux de travail ; toutes les autres sont secondaires.

## Limites de la structure du flux
<a name="workflow-structure-limits"></a>
+ **Nombre maximum d'étapes** : jusqu'à 256 étapes de transformation par flux de travail
+ **Tables sources** : 32 étapes d'importation maximum par flux de travail
+ **Colonnes de sortie** : jusqu'à 2 048 colonnes à chaque étape du flux de travail et table de sortie finale avec 2 000 colonnes
+ **Chemins divergents** : 5 chemins maximum par étape (SPICE uniquement, non applicable pour DirectQuery)
+ **Ensemble de données en tant que source** : jusqu'à 10 niveaux pour SPICE et DirectQuery

Ces limites sont conçues pour équilibrer flexibilité et performances, en permettant des transformations de données complexes tout en garantissant des capacités d'analyse optimales.

# Changements du comportement d'ingestion
<a name="ingestion-behavior-changes"></a>

La nouvelle expérience de préparation des données introduit un changement important dans la manière dont les problèmes de qualité des données sont traités lors de l'ingestion de SPICE. Ce changement a un impact significatif sur l'exhaustivité des données et la transparence de vos ensembles de données.

Dans l'ancienne expérience, en cas d'incohérence entre les types de données (tels que des formats de date incorrects ou des [problèmes similaires](errors-spice-ingestion.md)), la ligne entière contenant des cellules problématiques est ignorée lors de l'ingestion. Cette approche réduit le nombre de lignes dans le jeu de données final, ce qui peut masquer les problèmes de qualité des données.

La nouvelle expérience adopte une approche plus précise des incohérences dans les données. Lorsque vous rencontrez des cellules problématiques, seules les valeurs incohérentes sont converties en valeurs nulles tout en conservant la ligne entière. Cette conservation garantit que les données associées dans d'autres colonnes restent accessibles pour analyse.

**Impact sur la qualité des jeux de données**

Les ensembles de données créés dans la nouvelle expérience contiennent généralement plus de lignes que leurs homologues existants lorsque les données sources contiennent des incohérences. Cette approche améliorée présente plusieurs avantages :
+ Amélioration de l'exhaustivité des données en conservant toutes les lignes
+ Plus grande transparence dans l'identification des problèmes de qualité des données
+ Meilleure visibilité des valeurs problématiques pour la correction
+ Conservation des données associées dans des colonnes non affectées

Cette modification permet aux analystes d'identifier et de résoudre les problèmes de qualité des données de manière plus efficace, au lieu d'omettre silencieusement les lignes problématiques de l'ensemble de données.

# Questions fréquentes (FAQ)
<a name="new-data-prep-faqs"></a>

## 1. Quand les utilisateurs doivent-ils passer de la nouvelle expérience à l'ancienne ?
<a name="faq-1"></a>

Les utilisateurs doivent revenir à l'ancienne expérience lorsqu'ils travaillent avec des ensembles de données contenant des fonctionnalités actuellement [non prises en charge](unsupported-features.md). Quick Sight travaille activement à l'intégration de ces fonctionnalités dans la nouvelle expérience dans les prochaines versions.

## 2. Pourquoi les ensembles de données sont-ils grisés lorsque vous essayez de les ajouter dans la nouvelle expérience ? Les ensembles de données peuvent-ils être combinés entre les expériences existantes et les nouvelles expériences ?
<a name="faq-2"></a>

Actuellement, les ensembles de données parent et enfant doivent exister dans le même environnement d'expérience. Vous ne pouvez pas combiner des ensembles de données entre des expériences anciennes et nouvelles, car la nouvelle expérience inclut des fonctionnalités supplémentaires non disponibles dans les anciennes expériences, telles que les fonctionnalités d'ajout, les fonctionnalités Pivot et Divergence.

**Utilisation des ensembles de données parents issus de l'ancienne expérience**

Pour utiliser les ensembles de données parents issus de l'ancienne expérience, vous pouvez revenir à cet environnement. Accédez simplement à la page de préparation des données et choisissez **Retourner à l'ancienne expérience** dans le coin supérieur droit. Une fois sur place, vous pouvez créer les ensembles de données de votre enfant selon vos besoins.

**Développement futur**

Nous prévoyons de mettre en œuvre une fonctionnalité qui permettra aux utilisateurs de mettre à niveau les anciens ensembles de données vers la nouvelle expérience. Ce parcours amélioré permettra d'utiliser les anciens ensembles de données parents dans le cadre de la nouvelle expérience.

## 3. Pourquoi Quick Sight lance-t-il la nouvelle expérience de préparation des données avant d'atteindre la parité complète des fonctionnalités avec l'expérience existante ?
<a name="faq-3"></a>

La nouvelle expérience de préparation des données a été développée grâce à une étroite collaboration avec les clients afin de relever les défis analytiques du monde réel. Le lancement initial donne la priorité aux éléments suivants :

**Capacités améliorées**
+ Workflows de transformation visuelle
+ Transparence des processus améliorée
+ Techniques de préparation avancées grâce à Divergence
+ De nouvelles fonctionnalités puissantes telles que Append, Aggregate et Pivot

**Adoption flexible**

Les utilisateurs peuvent choisir entre différentes expériences avant de publier des ensembles de données, ce qui garantit des flux de travail ininterrompus pendant que les équipes effectuent la transition à leur propre rythme. Cette approche permet un accès immédiat aux nouvelles fonctionnalités tout en maintenant la prise en charge des exigences spécialisées grâce à l'expérience existante.

## 4. Les fonctionnalités actuellement disponibles uniquement dans l'ancienne expérience seront-elles ajoutées à la nouvelle expérience ?
<a name="faq-4"></a>

Oui. Quick Sight travaille activement à l'intégration des fonctionnalités existantes dans la nouvelle expérience.

## 5. Comment les modifications de l'API affectent-elles les scripts de création de jeux de données existants ?
<a name="faq-5"></a>

Quick Sight maintient la rétrocompatibilité tout en introduisant de nouvelles fonctionnalités :
+ Scripts existants : les anciens scripts d'API continueront de fonctionner, créant des ensembles de données dans l'ancienne expérience
+ Dénomination des API : les noms actuels des API restent inchangés
+ Nouvelles fonctionnalités : des formats d'API supplémentaires prennent en charge les fonctionnalités améliorées de la nouvelle expérience
+ Documentation : Les spécifications complètes de l'API pour la nouvelle expérience sont disponibles dans notre référence d'API

## 6. Les ensembles de données peuvent-ils être convertis entre expériences après publication ?
<a name="faq-6"></a>
+ Future voie de migration : Quick Sight ajoutera ultérieurement une fonctionnalité permettant de migrer facilement les anciens ensembles de données vers la nouvelle expérience.
+ Processus unidirectionnel : la conversion des ensembles de données de la nouvelle expérience au format existant n'est pas prise en charge en raison de dépendances entre fonctionnalités avancées