Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Modifica la configurazione di campionamento del flusso di dati
Quando si importano dati tabulari in un flusso di dati di Data Wrangler, è possibile scegliere di prelevare un campione del set di dati per accelerare il processo di esplorazione e pulizia dei dati. L'esecuzione di trasformazioni esplorative su un campione del set di dati è spesso più veloce rispetto all'esecuzione di trasformazioni sull'intero set di dati e, quando sei pronto per esportare il set di dati e creare un modello, puoi applicare le trasformazioni all'intero set di dati.
Canvas supporta i seguenti metodi di campionamento:
FirstK — Canvas seleziona i primi K elementi dal set di dati, dove K è un numero specificato. Questo metodo di campionamento è semplice ma può introdurre distorsioni se il set di dati non è ordinato in modo casuale.
Casuale: Canvas seleziona gli elementi dal set di dati in modo casuale, con ogni elemento che ha la stessa probabilità di essere scelto. Questo metodo di campionamento aiuta a garantire che il campione sia rappresentativo dell'intero set di dati.
Stratificato: Canvas divide il set di dati in gruppi (o strati) in base a uno o più attributi (ad esempio, età e livello di reddito). Quindi, un numero proporzionale di elementi viene selezionato casualmente da ciascun gruppo. Questo metodo garantisce che tutti i sottogruppi pertinenti siano adeguatamente rappresentati nel campione.
È possibile modificare la configurazione di campionamento in qualsiasi momento per modificare la dimensione del campione utilizzato per l'esplorazione dei dati.
Per apportare modifiche alla configurazione di campionamento, effettuate le seguenti operazioni:
Nel grafico del flusso di dati, seleziona il nodo dell'origine dati.
Scegli Sampling nella barra di navigazione in basso.
Viene visualizzata la finestra di dialogo Sampling. Nel menu a discesa Metodo di campionamento, selezionate il metodo di campionamento desiderato.
Per Dimensione massima del campione, inserisci il numero di righe da campionare.
Scegli Update (Aggiorna) per salvare le modifiche.
Le modifiche alla configurazione di campionamento dovrebbero ora essere applicate.