Generazione di visualizzazioni e approfondimenti sui dati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Generazione di visualizzazioni e approfondimenti sui dati

Dopo aver importato i dati in Data Wrangler, puoi utilizzarli per generare visualizzazioni e approfondimenti sui dati.

  • Visualizzazioni: Data Wrangler può generare diversi tipi di grafici, come istogrammi e grafici a dispersione. Ad esempio, puoi generare un istogramma per identificare i valori anomali nei tuoi dati.

  • Informazioni sui dati: puoi utilizzare un rapporto sulla qualità e gli approfondimenti dei dati per Amazon Personalize per conoscere i tuoi dati attraverso approfondimenti sui dati e statistiche su colonne e righe. Questo rapporto può farti sapere se hai problemi di qualsiasi tipo nei tuoi dati. E puoi scoprire quali azioni puoi intraprendere per migliorare i tuoi dati. Queste azioni possono aiutarti a soddisfare i requisiti di risorse di Amazon Personalize, come i requisiti di formazione dei modelli, oppure possono portare a consigli migliori.

Dopo aver appreso i dati attraverso visualizzazioni e approfondimenti, puoi utilizzare queste informazioni per aiutarti ad applicare ulteriori trasformazioni per migliorare i tuoi dati. Oppure, se hai finito di preparare i dati, puoi elaborarli e importarli in Amazon Personalize. Per informazioni sulla trasformazione dei dati, consulta. Trasformazione dei dati Per informazioni sull'elaborazione e l'importazione dei dati, vedere. Elaborazione dei dati e loro importazione in Amazon Personalize

Generazione di visualizzazioni

È possibile utilizzare Data Wrangler per creare diversi tipi di grafici, come istogrammi e grafici a dispersione. Ad esempio, puoi generare un istogramma per identificare i valori anomali nei dati. Per generare una visualizzazione dei dati, aggiungi una fase di analisi al flusso e, da Tipo di analisi, scegli la visualizzazione che desideri creare.

Per ulteriori informazioni sulla creazione di visualizzazioni in Data Wrangler, consulta Analizza e visualizza nella Amazon SageMaker AI Developer Guide.

Generazione di approfondimenti sui dati

Puoi utilizzare Data Wrangler per generare un rapporto Data Quality and Insights per Amazon Personalize specifico per il tuo tipo di set di dati. Prima di generare il report, ti consigliamo di trasformare i dati per soddisfare i requisiti di Amazon Personalize. Ciò porterà a informazioni più pertinenti. Per ulteriori informazioni, consulta Trasformazione dei dati.

Contenuto del rapporto

Il rapporto Data Quality and Insights per Amazon Personalize include le seguenti sezioni:

  • Riepilogo: il riepilogo del rapporto include statistiche sui set di dati e avvisi ad alta priorità:

    • Statistiche sui set di dati: includono statistiche specifiche di Amazon Personalize, come il numero di utenti unici nei dati di interazione, e statistiche generali, come il numero di valori mancanti o valori anomali.

    • Avvertenze ad alta priorità: si tratta di informazioni specifiche di Amazon Personalize che hanno il maggiore impatto sulla formazione o sui consigli. Ogni avviso include un'azione consigliata che puoi intraprendere per risolvere il problema.

  • Righe duplicate e righe incomplete: queste sezioni includono informazioni su quali righe hanno valori mancanti e quali righe sono duplicate nei dati.

  • Riepilogo delle funzionalità: questa sezione include il tipo di dati per ogni colonna, le informazioni sui dati non valide o mancanti e il numero di avvisi.

  • Dettagli sulle funzionalità: questa sezione include sottosezioni con informazioni dettagliate per ciascuna colonna di dati. Ogni sottosezione include statistiche per la colonna, ad esempio il conteggio dei valori categoriali e le informazioni sui valori mancanti. Inoltre, ogni sottosezione include approfondimenti specifici di Amazon Personalize e azioni consigliate per le colonne di dati. Ad esempio, un'analisi potrebbe indicare che una colonna ha più di 30 categorie possibili.

Problemi relativi al tipo di dati

Il rapporto identifica le colonne che non sono del tipo di dati corretto e specifica il tipo richiesto. Per ottenere informazioni dettagliate relative a queste funzionalità, è necessario convertire il tipo di dati della colonna e generare nuovamente il rapporto. Per convertire il tipo, puoi utilizzare la trasformazione di Data Wrangler Parse Value as Type.

Informazioni dettagliate su Amazon Personalize

Gli approfondimenti di Amazon Personalize includono una scoperta e un'azione suggerita. L'azione è facoltativa. Ad esempio, il rapporto potrebbe includere informazioni e azioni relative al numero di categorie per una colonna di dati categoriali. Se non ritieni che la colonna sia categorica, puoi ignorare questa informazione e non intraprendere alcuna azione.

Fatta eccezione per piccole differenze di formulazione, le informazioni specifiche di Amazon Personalize sono le stesse delle informazioni su un singolo set di dati che potresti generare quando analizzi i tuoi dati con Amazon Personalize. Ad esempio, il rapporto di approfondimento di Data Wrangler include approfondimenti come «Il set di dati sulle interazioni di The Item ha solo X utenti unici con due o più interazioni». Ma non include approfondimenti come «L'X% degli elementi nel set di dati Items non ha interazioni nel set di dati sulle interazioni Item».

Per un elenco di possibili approfondimenti specifici di Amazon Personalize, consulta gli approfondimenti che non fanno riferimento a più set di dati in. Informazioni approfondite sui dati

Esempi di report

L'aspetto del report Amazon Personalize è lo stesso del report General Insights di Data Wrangler. Per alcuni esempi del rapporto di approfondimento generale, consulta Get Insights On Data and Data Quality nella Amazon SageMaker AI Developer Guide. L'esempio seguente mostra come funziona la sezione di riepilogo di un report per un set di dati sulle interazioni tra articoli. Include le statistiche sui set di dati e alcuni possibili avvisi sul set di dati sulle interazioni tra elementi ad alta priorità.

Rappresenta la sezione di riepilogo di un rapporto per un set di dati sulle interazioni tra elementi.

L'esempio seguente mostra come potrebbe apparire in un report la sezione dei dettagli delle funzionalità per una TYPE colonna EVENT _ di un set di dati sulle interazioni tra elementi.

Raffigura la sezione dei dettagli delle funzionalità per una TYPE colonna EVENT _ di un set di dati di interazioni tra elementi.

Generazione del report

Per generare il rapporto sulla qualità e gli approfondimenti dei dati per Amazon Personalize, scegli Ottieni informazioni sui dati per la tua trasformazione e crea un'analisi.

Per generare report sulla qualità e sugli approfondimenti dei dati per Amazon Personalize
  1. Scegli l'opzione + per la trasformazione che stai analizzando. Se non hai aggiunto una trasformazione, scegli + per la trasformazione dei tipi di dati. Data Wrangler aggiunge questa trasformazione automaticamente al tuo flusso.

  2. Scegli Ottieni informazioni sui dati. Viene visualizzato il pannello Crea analisi.

  3. Per il tipo di analisi, scegli Data Quality and Insights Report for Amazon Personalize.

  4. Per il tipo di set di dati, scegli il tipo di set di dati Amazon Personalize che stai analizzando.

  5. Facoltativamente, scegli Esegui su dati completi. Per impostazione predefinita, Data Wrangler genera approfondimenti solo su un campione di dati.

  6. Scegli Create (Crea) . Al termine dell'analisi, viene visualizzato il rapporto.