Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Preparazione dei dati di formazione per Amazon Personalize
Dopo aver scelto un caso d'uso o una ricetta per il dominio e aver annotato i relativi requisiti in materia di dati, sei pronto per iniziare a preparare i dati. Amazon Personalize può utilizzare i seguenti tipi di dati:
-
Interazioni tra articoli: in Amazon Personalize, un'interazione tra un articolo è un evento di interazione positiva tra un utente e un articolo del tuo catalogo. Ad esempio, un utente che guarda un film, visualizza un annuncio o acquista un paio di scarpe.
-
Articoli: i metadati degli articoli potrebbero includere informazioni come prezzo, SKU tipo, descrizione o disponibilità per ogni articolo del catalogo.
-
Utenti: i metadati degli utenti possono includere informazioni quali età, sesso, programma fedeltà, iscrizione e interessi per ciascuno dei tuoi utenti.
-
Azioni: un'azione è un'attività di coinvolgimento che potresti consigliare ai tuoi clienti. Le azioni possono includere l'installazione dell'app per dispositivi mobili, il completamento di un profilo di iscrizione, l'adesione al programma di fidelizzazione o l'iscrizione a e-mail promozionali. Per la ricetta Next-Best-Action, è richiesto il set di dati Actions. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati Actions.
-
Interazioni di azione: un'interazione di azione è un evento di interazione tra un utente e un'azione. La ricetta Next-Best-Action utilizza questi dati e i dati del set di dati Actions per consigliare azioni agli utenti. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati delle interazioni con le azioni.
Amazon Personalize archivia i dati in set di dati, uno per ogni tipo di dati. Ogni set di dati ha requisiti diversi. Quando importi dati in un set di dati Amazon Personalize, puoi scegliere di importare i record in blocco, singolarmente o entrambi. Le importazioni in blocco comportano l'importazione di un gran numero di record storici archiviati in uno o più CSV file in un bucket Amazon S3.
-
Se non disponi di dati in blocco, puoi utilizzare operazioni di importazione individuali per raccogliere dati e trasmettere eventi in streaming fino a soddisfare i requisiti di formazione di Amazon Personalize e i requisiti relativi ai dati del caso d'uso o della ricetta del tuo dominio. Per informazioni sulla registrazione degli eventi, consulta. Registrazione di eventi in tempo reale per influenzare le raccomandazioni Per informazioni sull'importazione di singoli record, vedereImportazione di singoli record in un set di dati Amazon Personalize.
-
Se non sei sicuro di disporre di dati sufficienti o se hai domande sulla loro qualità, puoi importare i dati in un set di dati Amazon Personalize e utilizzare Amazon Personalize per analizzarli. Per ulteriori informazioni, consulta Analisi della qualità e della quantità di dati nei set di dati di Amazon Personalize.
Le seguenti sezioni forniscono i requisiti di dati per ogni tipo di set di dati Amazon Personalize e le linee guida per la preparazione di dati in blocco. Se non disponi di dati in blocco, consulta le sezioni per comprendere i dati obbligatori e facoltativi che puoi importare con le singole operazioni di importazione. Se hai bisogno di ulteriore assistenza per la formattazione dei dati, puoi utilizzare Amazon SageMaker Data Wrangler (Data Wrangler) per preparare i dati. Per ulteriori informazioni, consulta Preparazione e importazione di dati in blocco con Amazon Data Wrangler SageMaker .
Dopo aver completato la preparazione dei dati, sei pronto per creare un file di schema. JSON Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize.
Argomenti
- Linee guida sul formato dei dati in blocco per tutti i tipi di dati
- Preparazione dei dati di interazione tra gli elementi per l'addestramento
- Preparazione dei metadati degli articoli per la formazione
- Preparazione dei metadati utente per la formazione
- Preparazione dei metadati delle azioni per la formazione
- Preparazione dei dati di interazione delle azioni per l'allenamento
Linee guida sul formato dei dati in blocco per tutti i tipi di dati
Le seguenti linee guida e requisiti possono aiutarti a garantire che i tuoi dati di massa siano formattati correttamente.
-
I dati di input devono trovarsi in un file CSV (valori separati da virgole).
-
La prima riga del CSV file deve contenere le intestazioni delle colonne. Non racchiudere intestazioni tra virgolette (").
-
Le colonne devono avere nomi alfanumerici univoci. Ad esempio, non è possibile aggiungere sia un
GENRES_FIELD_1
campo che un campo.GENRESFIELD1
-
Assicurati di avere i campi obbligatori per il tipo di set di dati e assicurati che i loro nomi siano conformi ai requisiti di Amazon Personalize. Ad esempio, i dati Items potrebbero avere una colonna chiamata
ITEM_IDENTIFICATION_NUMBER
with IDs per ciascuno dei tuoi articoli. Per utilizzare questa colonna come campo ITEM _ID, rinomina la colonna in.ITEM_ID
Se utilizzi Data Wrangler per formattare i dati, puoi utilizzare le colonne Map per la trasformazione di Amazon Personalize Data Wrangler per assicurarti che le colonne abbiano un nome corretto.Per informazioni sull'utilizzo di Data Wrangler per preparare i dati, consulta. Preparazione e importazione di dati in blocco con Amazon Data Wrangler SageMaker
-
Ogni record del CSV file deve essere su una sola riga.
-
Amazon Personalize non supporta tipi di dati complessi come array e mappe.
-
Per fare in modo che Amazon Personalize utilizzi dati booleani durante l'addestramento o il filtraggio, utilizza valori di stringa e/o valori numerici con valore
"False"
vero"True"
e falso.1
0
-
Se usi Data Wrangler per formattare i dati, puoi utilizzare Data Wrangler transform Parse Value as Type per convertire i tipi di dati.
-
TIMESTAMP
eCREATION_TIMESTAMP
i dati devono essere in formato epoch time. UNIX Per ulteriori informazioni, consulta Dati relativi al timestamp. -
Evita di includere
"
caratteri o caratteri speciali nei dati dell'ID dell'elemento, dell'ID utente e dell'ID dell'azione. -
Se i dati includono caratteri non ASCII codificati, il CSV file deve essere codificato nel formato UTF -8.
-
Assicurati di formattare tutti i dati testuali come descritto in. Metadati di testo non strutturati