Preparazione e importazione di dati con Amazon SageMaker Data Wrangler - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preparazione e importazione di dati con Amazon SageMaker Data Wrangler

Importante

L'utilizzo di Data Wrangler comporta dei costi. SageMaker Per un elenco completo di addebiti e prezzi, consulta la scheda Data Wrangler dei prezzi di Amazon SageMaker . Per evitare di incorrere in costi aggiuntivi, quando hai finito, chiudi l'istanza di Data Wrangler. Per ulteriori informazioni, consulta Shut Down Data Wrangler.

Dopo aver creato un gruppo di set di dati, puoi utilizzare Amazon SageMaker Data Wrangler (Data Wrangler) per importare dati da oltre 40 fonti in un set di dati Amazon Personalize. Data Wrangler è una funzionalità di Amazon SageMaker Studio Classic che fornisce una end-to-end soluzione per importare, preparare, trasformare e analizzare i dati. Non puoi utilizzare Data Wrangler per preparare e importare dati in un set di dati Actions o in un set di dati di interazioni Action.

Quando usi Data Wrangler per preparare e importare dati, utilizzi un flusso di dati. Un flusso di dati definisce una serie di passaggi di preparazione dei dati tramite machine learning, a partire dall'importazione dei dati. Ogni volta che aggiungi un passaggio al flusso, Data Wrangler esegue un'azione sui dati, ad esempio trasformandoli o generando una visualizzazione.

Di seguito sono riportati alcuni passaggi che puoi aggiungere al flusso per preparare i dati per Amazon Personalize:

  • Insights: puoi aggiungere passaggi di analisi specifici di Amazon Personalize al tuo flusso. Queste informazioni possono aiutarti a conoscere i tuoi dati e quali azioni puoi intraprendere per migliorarli.

  • Visualizzazioni: puoi aggiungere passaggi di visualizzazione per generare grafici come istogrammi e grafici a dispersione. I grafici possono aiutarti a scoprire problemi nei dati, come valori anomali o valori mancanti.

  • Trasformazioni: puoi utilizzare le fasi di trasformazione specifiche e generali di Amazon Personalize per assicurarti che i tuoi dati soddisfino i requisiti di Amazon Personalize. La trasformazione di Amazon Personalize ti aiuta a mappare le colonne di dati alle colonne obbligatorie a seconda del tipo di set di dati Amazon Personalize.

Se devi lasciare Data Wrangler prima di importare i dati in Amazon Personalize, puoi tornare al punto in cui avevi interrotto scegliendo lo stesso tipo di set di dati quando avvii Data Wrangler dalla console Amazon Personalize. Oppure puoi accedere a Data Wrangler direttamente tramite Studio Classic. SageMaker

Ti consigliamo di importare i dati da Data Wrangler in Amazon Personalize come segue. Le fasi di trasformazione, visualizzazione e analisi sono opzionali, ripetibili e possono essere completate in qualsiasi ordine.

  1. Configura le autorizzazioni: configura le autorizzazioni per Amazon Personalize SageMaker e i ruoli di servizio. E configura le autorizzazioni per i tuoi utenti.

  2. Avvia Data Wrangler in SageMaker Studio Classic dalla console Amazon Personalize: utilizza la console Amazon Personalize per configurare SageMaker un dominio e avviare Data Wrangler in Studio Classic. SageMaker

  3. Importa i tuoi dati in Data Wrangler - Importa dati da oltre 40 fonti in Data Wrangler. Le fonti includono AWS servizi, come Amazon Redshift, Amazon o Amazon AthenaEMR, e terze parti come Snowflake o. DataBricks

  4. Trasforma i tuoi dati: usa Data Wrangler per trasformare i tuoi dati in modo da soddisfare i requisiti di Amazon Personalize.

  5. Visualizza e analizza i tuoi dati: usa Data Wrangler per visualizzare i tuoi dati e analizzarli tramite informazioni specifiche di Amazon Personalize.

  6. Elabora e importa dati in Amazon Personalize: usa un notebook SageMaker Studio Classic Jupyter per importare i dati elaborati in Amazon Personalize.

Informazioni aggiuntive

Le seguenti risorse forniscono informazioni aggiuntive sull'uso di Amazon SageMaker Data Wrangler e Amazon Personalize.