Preparazione dei dati di formazione per Amazon Personalize - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preparazione dei dati di formazione per Amazon Personalize

Dopo aver scelto un caso d'uso o una ricetta per il dominio e aver annotato i relativi requisiti in materia di dati, sei pronto per iniziare a preparare i dati. Amazon Personalize può utilizzare i seguenti tipi di dati:

  • Interazioni tra articoli: in Amazon Personalize, un'interazione tra un articolo è un evento di interazione positiva tra un utente e un articolo del tuo catalogo. Ad esempio, un utente che guarda un film, visualizza un annuncio o acquista un paio di scarpe.

  • Articoli: i metadati degli articoli potrebbero includere informazioni come prezzo, SKU tipo, descrizione o disponibilità per ogni articolo del catalogo.

  • Utenti: i metadati degli utenti possono includere informazioni quali età, sesso, programma fedeltà, iscrizione e interessi per ciascuno dei tuoi utenti.

  • Azioni: un'azione è un'attività di coinvolgimento che potresti consigliare ai tuoi clienti. Le azioni possono includere l'installazione dell'app per dispositivi mobili, il completamento di un profilo di iscrizione, l'adesione al programma di fidelizzazione o l'iscrizione a e-mail promozionali. Per la ricetta Next-Best-Action, è richiesto il set di dati Actions. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati Actions.

  • Interazioni di azione: un'interazione di azione è un evento di interazione tra un utente e un'azione. La ricetta Next-Best-Action utilizza questi dati e i dati del set di dati Actions per consigliare azioni agli utenti. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati delle interazioni con le azioni.

Amazon Personalize archivia i dati in set di dati, uno per ogni tipo di dati. Ogni set di dati ha requisiti diversi. Quando importi dati in un set di dati Amazon Personalize, puoi scegliere di importare i record in blocco, singolarmente o entrambi. Le importazioni in blocco comportano l'importazione di un gran numero di record storici archiviati in uno o più CSV file in un bucket Amazon S3.

Le seguenti sezioni forniscono i requisiti di dati per ogni tipo di set di dati Amazon Personalize e le linee guida per la preparazione di dati in blocco. Se non disponi di dati in blocco, consulta le sezioni per comprendere i dati obbligatori e facoltativi che puoi importare con le singole operazioni di importazione. Se hai bisogno di ulteriore assistenza per la formattazione dei dati, puoi utilizzare Amazon SageMaker Data Wrangler (Data Wrangler) per preparare i dati. Per ulteriori informazioni, consulta Preparazione e importazione di dati in blocco con Amazon Data Wrangler SageMaker .

Dopo aver completato la preparazione dei dati, sei pronto per creare un file di schema. JSON Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize.

Linee guida sul formato dei dati in blocco per tutti i tipi di dati

Le seguenti linee guida e requisiti possono aiutarti a garantire che i tuoi dati di massa siano formattati correttamente.

  • I dati di input devono trovarsi in un file CSV (valori separati da virgole).

  • La prima riga del CSV file deve contenere le intestazioni delle colonne. Non racchiudere intestazioni tra virgolette (").

  • Le colonne devono avere nomi alfanumerici univoci. Ad esempio, non è possibile aggiungere sia un GENRES_FIELD_1 campo che un campo. GENRESFIELD1

  • Assicurati di avere i campi obbligatori per il tipo di set di dati e assicurati che i loro nomi siano conformi ai requisiti di Amazon Personalize. Ad esempio, i dati Items potrebbero avere una colonna chiamata ITEM_IDENTIFICATION_NUMBER with IDs per ciascuno dei tuoi articoli. Per utilizzare questa colonna come campo ITEM _ID, rinomina la colonna in. ITEM_ID Se utilizzi Data Wrangler per formattare i dati, puoi utilizzare le colonne Map per la trasformazione di Amazon Personalize Data Wrangler per assicurarti che le colonne abbiano un nome corretto.

    Per informazioni sull'utilizzo di Data Wrangler per preparare i dati, consulta. Preparazione e importazione di dati in blocco con Amazon Data Wrangler SageMaker

  • Ogni record del CSV file deve essere su una sola riga.

  • Amazon Personalize non supporta tipi di dati complessi come array e mappe.

  • Per fare in modo che Amazon Personalize utilizzi dati booleani durante l'addestramento o il filtraggio, utilizza valori di stringa e/o valori numerici con valore "False" vero "True" e falso. 1 0

  • Se usi Data Wrangler per formattare i dati, puoi utilizzare Data Wrangler transform Parse Value as Type per convertire i tipi di dati.

  • TIMESTAMPe CREATION_TIMESTAMP i dati devono essere in formato epoch time. UNIX Per ulteriori informazioni, consulta Dati relativi al timestamp.

  • Evita di includere " caratteri o caratteri speciali nei dati dell'ID dell'elemento, dell'ID utente e dell'ID dell'azione.

  • Se i dati includono caratteri non ASCII codificati, il CSV file deve essere codificato nel formato UTF -8.

  • Assicurati di formattare tutti i dati testuali come descritto in. Metadati di testo non strutturati