Dépannage des erreurs de lignes sautées - Amazon QuickSight

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Dépannage des erreurs de lignes sautées

Lorsque vous importez des données, Amazon QuickSight prévisualise une partie de vos données. S'il ne parvient pas à interpréter une ligne pour quelque raison que ce soit, QuickSight ignore la ligne. Dans certains cas, l'importation échouera. Dans ce cas, QuickSight renvoie un message d'erreur expliquant l'échec.

Le nombre d'erreurs possibles est heureusement limité. Certains problèmes peuvent être évités en étant conscient des exemples suivants :

  • Assurez-vous qu'il n'y a pas d'incohérence entre le type de données du champ et les données du champ, par exemple des données de type chaîne de caractères dans un champ de type numérique. Voici quelques exemples qui peuvent être difficiles à détecter lors de l'analyse du contenu d'une table :

    • '' – Utilisation d'une chaîne vide pour indiquer une valeur manquante

    • 'NULL' – Utilisation du mot « null » pour indiquer une valeur manquante

    • $1000 – Inclusion d'un signe de dollar dans une valeur monétaire pour la transformer en chaîne de connexion

    • 'O'Brien' – Utilisation d'une ponctuation pour marquer une chaîne de caractères qui contient elle-même la même ponctuation.

    Cependant, ce type d'erreur n'est pas toujours aussi facile à trouver, surtout si vous avez beaucoup de données ou si vos données sont saisies à la main. Par exemple, certaines applications de service à la clientèle ou de vente impliquent la saisie d'informations fournies verbalement par les clients. La personne qui a saisi les données à l'origine peut les avoir placées dans le mauvais champ. Elle peut ajouter ou oublier d'ajouter un caractère ou un chiffre. Par exemple, elle peut saisir une date de « 0/10/12020 » ou indiquer le sexe d'une personne dans un champ réservé à l'âge.

  • Assurez-vous que votre fichier importé est correctement traité avec ou sans en-tête. S'il y a une ligne d'en-tête, veillez à choisir l'option de chargement Contient l'en-tête.

  • Assurez-vous que les données ne dépassent pas un ou plusieurs des Quotas de source de données.

  • Assurez-vous que les données sont compatibles avec les Valeurs et types de données pris en charge.

  • Assurez-vous que vos champs calculés contiennent des données qui fonctionnent avec le calcul, plutôt que d'être incompatibles avec la fonction du champ calculé ou d'en être exclues. Par exemple, si un champ calculé de votre jeu de données utiliseparseDate, QuickSight ignore les lignes où ce champ ne contient pas de date valide.

QuickSight fournit une liste détaillée des erreurs qui se produisent lorsque le SPICE moteur tente d'ingérer des données. Lorsqu'un jeu de données enregistré signale des lignes ignorées, vous pouvez afficher les erreurs afin de prendre les mesures nécessaires pour résoudre les problèmes.

Pour afficher les erreurs relatives aux lignes ignorées lors de l'ingestion (importation de données) de SPICE
  1. Dans la page Jeux de données, sélectionnez le jeu de données problématique pour l'ouvrir.

  2. Sur la page de détails du jeu de données qui s'ouvre, cliquez sur l'onglet Actualiser.

    SPICEl'historique d'ingestion est indiqué en bas.

  3. Pour l'ingestion contenant l'erreur, sélectionnez Afficher le résumé de l'erreur. Ce lien se trouve sous la colonne Statut.

  4. Examinez le Journal d'importation de fichiers qui s'ouvre. Il affiche les sections suivantes :

    • Résumé – Indique, sous forme de pourcentage, le nombre de lignes ignorées par rapport au nombre total de lignes de l'importation. Par exemple, s'il y a 864 lignes ignorées sur un total de 1 728, le score est de 50,00 %.

    • Lignes ignorées – Fournit le nombre de lignes, le nom du champ et le message d'erreur pour chaque ensemble de lignes ignorées similaires.

    • Dépannage – Fournit un lien pour télécharger un fichier contenant des informations sur les erreurs.

  5. Sous Dépannage, sélectionnez Télécharger le fichier des lignes d'erreur.

    Le fichier d'erreurs contient une ligne pour chaque erreur. Le fichier est nommé error-report_123_fe8.csv, où 123_fe8 est remplacé par une chaîne d'identification unique. Le fichier contient les colonnes suivantes :

    • ERROR_ TYPE — Type ou code d'erreur correspondant à l'erreur survenue lors de l'importation de cette ligne. Vous pouvez consulter cette erreur dans la section Codes d'erreur d'ingestion SPICE qui suit cette procédure.

    • COLUMN_ NAME — Le nom de la colonne de vos données à l'origine de l'erreur.

    • Toutes les colonnes de votre ligne importée – Les colonnes restantes dupliquent la ligne entière de données. Si une ligne comporte plusieurs erreurs, elle peut apparaître plusieurs fois dans ce fichier.

  6. Sélectionnez Modifier le jeu de données pour apporter des modifications à votre jeu de données. Vous pouvez filtrer les données, omettre des champs, modifier les types de données, ajuster les champs calculés existants et ajouter des champs calculés qui valident les données.

  7. Après avoir apporté les modifications indiquées par les codes d'erreur, importez à nouveau les données. Si d'autres erreurs d'ingestion SPICE apparaissent dans le journal, recommencez cette procédure pour corriger toutes les erreurs restantes.

Astuce

Si vous ne parvenez pas à résoudre les problèmes de données dans un délai raisonnable en utilisant l'éditeur de jeux de données, consultez les administrateurs ou les développeurs qui possèdent les données. À long terme, il est plus rentable de nettoyer les données à proximité de leur source, plutôt que d'ajouter un traitement des exceptions pendant que vous préparez les données pour l'analyse. En corrigeant les erreurs à la source, vous évitez que plusieurs personnes ne les corrigent de manière différente, ce qui se traduirait ultérieurement par des résultats différents dans les rapports.

Pour vous entraîner à dépanner les lignes sautées
  1. Téléchargement CSV files for troubleshooting skipped rows.zip.

  2. Extrayez les fichiers dans un dossier dans QuickSight lequel vous pouvez télécharger l'exemple de fichier .csv.

    Le fichier zip contient les deux fichiers texte suivants :

    • sample dataset - data ingestion error.csv – Un exemple de fichier .csv contenant les problèmes à l'origine des lignes sautées. Vous pouvez essayer d'importer le fichier vous-même pour voir comment fonctionne le processus d'erreur.

    • sample data ingestion error file— Un exemple de fichier d'erreur généré lors de SPICE l'ingestion lors de l'importation de l'exemple de fichier .csv dans QuickSight.

  3. Importez les données en suivant les étapes suivantes :

    1. Choisissez Jeux de données, Nouveau jeu de données.

    2. Choisissez Upload a file.

    3. Recherchez et sélectionnez le fichier nommé sample dataset - data ingestion error.csv.

    4. Choisissez Charger un fichier, Modifier les paramètres et préparer les données.

    5. Choisissez Enregistrer pour quitter.

  4. Sélectionnez votre jeu de données pour afficher ses informations, puis choisissez Afficher le résumé des erreurs. Examinez les erreurs et les données pour vous aider à résoudre les problèmes.