Esplorazione dei dati utilizzando tecniche di visualizzazione - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esplorazione dei dati utilizzando tecniche di visualizzazione

Nota

Puoi utilizzare le visualizzazioni SageMaker Canvas solo per modelli basati su set di dati tabulari. Sono esclusi anche i modelli di previsione del testo multicategoria.

Con Amazon SageMaker Canvas, puoi esplorare e visualizzare i tuoi dati per ottenere informazioni avanzate sui tuoi dati prima di creare i tuoi modelli di machine learning. È possibile visualizzare utilizzando grafici a dispersione, grafici a barre e diagrammi a scatola e baffi, che possono aiutarti a comprendere i dati e scoprire le relazioni tra le caratteristiche che potrebbero influire sulla precisione del modello.

Nella scheda Build dell'applicazione SageMaker Canvas, scegli Data visualizer per iniziare a creare le tue visualizzazioni.

È possibile modificare la dimensione del campione di visualizzazione per regolare la dimensione del campione casuale prelevato dal set di dati. Una dimensione del campione troppo grande potrebbe influire sulle prestazioni delle visualizzazioni dei dati, per cui ti consigliamo di scegliere una dimensione del campione appropriata. Per modificare la dimensione del campione, procedi come indicato di seguito.

  1. Scegli Esempio di visualizzazione.

  2. Utilizza il dispositivo di scorrimento per selezionare la dimensione del campione desiderata.

  3. Scegli Aggiorna per confermare la modifica della dimensione del campione.

Nota

Alcune tecniche di visualizzazione richiedono colonne con un tipo di dati specifico. Ad esempio, è possibile utilizzare solo colonne numeriche per gli assi x e y dei grafici a dispersione.

Grafico a dispersione

Per creare un grafico a dispersione con il tuo set di dati, scegli Grafico a dispersione nel pannello Visualizzazione. Scegli le caratteristiche che desideri tracciare sugli assi x e y dalla sezione Colonne. Puoi trascinare le colonne sugli assi oppure, una volta che un asse è stato rilasciato, puoi scegliere una colonna dall'elenco delle colonne supportate.

È possibile utilizzare Colore da per colorare i punti dati sul grafico con una terza funzione. Inoltre, puoi utilizzare Raggruppa per raggruppare i dati in grafici separati in base a una quarta funzionalità.

L'immagine seguente mostra un grafico a dispersione che utilizza Colore da e Raggruppa per. In questo esempio, ogni punto dati è colorato in base alla caratteristiche MaritalStatus e il raggruppamento in base ai risultati della caratteristica Department genera un grafico a dispersione per i punti dati di ogni reparto.

Screenshot di un grafico a dispersione nella visualizzazione Visualizzatore dati dell'applicazione Canvas.

Grafico a barre

Per creare un grafico a barre con il tuo set di dati, scegli Grafico a barre nel pannello Visualizzazione. Scegliete le caratteristiche che desiderate tracciare sugli assi x e y dalla sezione Colonne. Puoi trascinare le colonne sugli assi oppure, una volta che un asse è stato rilasciato, puoi scegliere una colonna dall'elenco delle colonne supportate.

È possibile utilizzare Raggruppa per raggruppare il grafico a barre in base a una terza funzionalità. È possibile utilizzare In pila per ombreggiare verticalmente ogni barra in base ai valori univoci di una quarta funzionalità.

L'immagine seguente mostra un grafico a barre che utilizza Raggruppa per e Impila per. In questo esempio, il grafico a barre è raggruppato in base alla caratteristica MaritalStatus e impilato in base alla caratteristica JobLevel. Per ogni JobRole sull'asse x, c'è una barra separata per le categorie univoche della caratteristica MaritalStatus e ogni barra è impilata verticalmente dalla caratteristica JobLevel.

Screenshot di un grafico a barre nella vista Visualizzatore dati dell'applicazione Canvas.

Diagramma a scatola

Per creare un diagramma a scatola con il tuo set di dati, scegli Diagramma a scatola nel pannello Visualizzazione. Scegliete le caratteristiche che desiderate tracciare sugli assi x e y dalla sezione Colonne. Puoi trascinare le colonne sugli assi oppure, una volta che un asse è stato rilasciato, puoi scegliere una colonna dall'elenco delle colonne supportate.

È possibile utilizzare Raggruppa per per raggruppare i diagramma a scatola in base a una terza funzione.

L'immagine seguente mostra un diagramma a scatola che utilizza Raggruppa per. In questo esempio, gli assi x e y mostrano JobLevel eJobSatisfaction, rispettivamente, i diagrammi a scatola colorati sono raggruppati in base alla caratteristica Department.

Screenshot di un diagramma a scatola nella vista Visualizzatore dati dell'applicazione Canvas.