Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Validation des données
Avant de créer votre modèle, SageMaker Canvas vérifie que votre jeu de données ne présente aucun problème susceptible d'entraîner l'échec de votre génération. Si SageMaker Canvas détecte des problèmes, il vous avertit sur la page Créer avant de tenter de créer un modèle.
Vous pouvez choisir Validate data (Valider les données) pour consulter la liste des problèmes liés à votre jeu de données. Vous pouvez ensuite utiliser les fonctionnalités de préparation des données de SageMaker Canvas Data Wrangler, ou vos propres outils, pour corriger votre ensemble de données avant de commencer une construction. Si vous ne résolvez pas les problèmes liés à votre jeu de données, la création échoue.
Si vous apportez des modifications à votre jeu de données pour résoudre les problèmes, vous avez la possibilité de revalider votre jeu de données avant de tenter une génération. Nous vous recommandons de revalider votre jeu de données avant d'effectuer la génération.
Le tableau suivant indique les problèmes détectés par SageMaker Canvas dans votre ensemble de données et explique comment les résoudre.
Problème | Résolution |
---|---|
Type de modèle incorrect pour vos données |
Essayez un autre type de modèle ou utilisez un autre jeu de données. |
Valeurs manquantes dans votre colonne cible |
Remplacez les valeurs manquantes, supprimez les lignes présentant des valeurs manquantes ou utilisez un autre jeu de données. |
Trop d'étiquettes uniques dans votre colonne cible |
Vérifiez que vous avez utilisé la bonne colonne comme colonne cible ou utilisez un autre jeu de données. |
Trop de valeurs non numériques dans votre colonne cible |
Choisissez une autre colonne cible, sélectionnez un autre type de modèle ou utilisez un autre jeu de données. |
Un ou plusieurs noms de colonne contiennent des doubles traits de soulignement |
Renommez les colonnes pour supprimer tous les doubles traits de soulignement et réessayez. |
Aucune des lignes de votre jeu de données n'est complète |
Remplacez les valeurs manquantes ou utilisez un autre jeu de données. |
Trop d'étiquettes uniques par rapport au nombre de lignes dans vos données |
Vérifiez que vous utilisez la bonne colonne cible, augmentez le nombre de lignes dans votre jeu de données, consolidez des étiquettes similaires ou utilisez un jeu de données différent. |