Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Échantillon aléatoire
SageMaker Canvas utilise la méthode d'échantillonnage aléatoire pour échantillonner votre ensemble de données. La méthode d'échantillonnage aléatoire signifie que toutes les lignes ont la même chance d'être sélectionnées pour l'échantillon. Vous pouvez cliquer sur une colonne de la prévisualisation pour obtenir des statistiques récapitulatives de l'échantillon aléatoire, telles que la moyenne et le mode.
Par défaut, SageMaker Canvas utilise une taille d'échantillon aléatoire de 20 000 lignes de votre jeu de données pour les ensembles de données de plus de 20 000 lignes. Pour les jeux de données de moins de 20 000 lignes, la taille d'échantillon par défaut est le nombre de lignes de votre jeu de données. Vous pouvez augmenter ou diminuer la taille de l'échantillon en choisissant Échantillon aléatoire dans l'onglet Créer de l'application SageMaker Canvas. Vous pouvez utiliser le curseur pour sélectionner la taille d'échantillon souhaitée, puis choisir Update (Mettre à jour) pour changer la taille de l'échantillon. La taille d'échantillon maximale que vous pouvez choisir pour un jeu de données est de 40 000 lignes et la taille d'échantillon minimale est de 500 lignes. Si vous choisissez une grande taille d'échantillon, le rechargement de l'aperçu du jeu de données et des statistiques récapitulatives peut prendre quelques instants.
La page Build (Génération) affiche un aperçu de 100 lignes de votre jeu de données. Si la taille de l'échantillon est identique à celle de votre jeu de données, l'aperçu utilise les 100 premières lignes de votre jeu de données. Dans le cas contraire, l'aperçu utilise les 100 premières lignes de l'échantillon aléatoire.