Linee guida sul formato dei dati in blocco per tutti i tipi di dati

Preparazione dei dati di formazione per Amazon Personalize

Dopo aver scelto un caso d'uso o una ricetta per il dominio e aver annotato i relativi requisiti in materia di dati, sei pronto per iniziare a preparare i dati. Amazon Personalize può utilizzare i seguenti tipi di dati:

Interazioni tra articoli: in Amazon Personalize, un'interazione tra un articolo è un evento di interazione positiva tra un utente e un articolo del tuo catalogo. Ad esempio, un utente che guarda un film, visualizza un annuncio o acquista un paio di scarpe.
Articoli: i metadati degli articoli potrebbero includere informazioni come prezzo, tipo di SKU, descrizione o disponibilità per ogni articolo del catalogo.
Utenti: i metadati degli utenti possono includere informazioni quali età, sesso, programma fedeltà, iscrizione e interessi per ciascuno dei tuoi utenti.
Azioni: un'azione è un'attività di coinvolgimento che potresti consigliare ai tuoi clienti. Le azioni possono includere l'installazione dell'app per dispositivi mobili, il completamento di un profilo di iscrizione, l'adesione al programma di fidelizzazione o l'iscrizione a e-mail promozionali. Per la Next-Best-Action ricetta, è richiesto il set di dati Actions. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati Actions.
Interazioni di azione: un'interazione di azione è un evento di interazione tra un utente e un'azione. La Next-Best-Action ricetta utilizza questi dati e i dati del set di dati Actions per consigliare azioni agli utenti. Nessun'altra ricetta personalizzata o caso d'uso del dominio utilizza i dati delle interazioni con le azioni.

Amazon Personalize archivia i dati in set di dati, uno per ogni tipo di dati. Ogni set di dati ha requisiti diversi. Quando importi dati in un set di dati Amazon Personalize, puoi scegliere di importare i record in blocco, singolarmente o entrambi. Le importazioni in blocco comportano l'importazione di un gran numero di record storici archiviati in uno o più file CSV in un bucket Amazon S3.

Se non disponi di dati in blocco, puoi utilizzare operazioni di importazione individuali per raccogliere dati e trasmettere eventi in streaming fino a soddisfare i requisiti di formazione di Amazon Personalize e i requisiti relativi ai dati del caso d'uso o della ricetta del tuo dominio. Per informazioni sulla registrazione degli eventi, consulta. Registrazione di eventi in tempo reale per influenzare le raccomandazioni Per informazioni sull'importazione di singoli record, vedereImportazione di singoli record in un set di dati Amazon Personalize.
Se non sei sicuro di disporre di dati sufficienti o se hai domande sulla loro qualità, puoi importare i dati in un set di dati Amazon Personalize e utilizzare Amazon Personalize per analizzarli. Per ulteriori informazioni, consulta Analisi della qualità e della quantità di dati nei set di dati di Amazon Personalize.

Le seguenti sezioni forniscono i requisiti di dati per ogni tipo di set di dati Amazon Personalize e le linee guida per la preparazione di dati in blocco. Se non disponi di dati in blocco, consulta le sezioni per comprendere i dati obbligatori e facoltativi che puoi importare con le singole operazioni di importazione. Se hai bisogno di ulteriore assistenza per la formattazione dei dati, puoi utilizzare Amazon SageMaker AI Data Wrangler (Data Wrangler) per preparare i dati. Per ulteriori informazioni, consulta Preparazione e importazione di dati in blocco con Amazon SageMaker AI Data Wrangler.

Dopo aver completato la preparazione dei dati, sei pronto per creare un file JSON di schema. Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di file JSON di schema per schemi Amazon Personalize.

Argomenti

Linee guida sul formato dei dati in blocco per tutti i tipi di dati

Le seguenti linee guida e requisiti possono aiutarti a garantire che i tuoi dati di massa siano formattati correttamente.

I dati di input devono essere in un file CSV (valori separati da virgole).
La prima riga del file CSV deve contenere le intestazioni delle colonne. Non racchiudere intestazioni tra virgolette (").
Le colonne devono avere nomi alfanumerici univoci. Ad esempio, non è possibile aggiungere sia un GENRES_FIELD_1 campo che un campo. GENRESFIELD1
Se stai importando più file CSV, tutte le intestazioni di colonna devono corrispondere in tutti i file.
Assicurati di avere i campi obbligatori per il tipo di set di dati e assicurati che i loro nomi siano conformi ai requisiti di Amazon Personalize. Ad esempio, i dati Items potrebbero avere una colonna chiamata ITEM_IDENTIFICATION_NUMBER with IDs per ciascuno dei tuoi articoli. Per utilizzare questa colonna come campo ITEM_ID, rinomina la colonna in. ITEM_ID Se utilizzi Data Wrangler per formattare i tuoi dati, puoi utilizzare le colonne Map per la trasformazione di Amazon Personalize Data Wrangler per assicurarti che le colonne abbiano un nome corretto.

Per informazioni sull'utilizzo di Data Wrangler per preparare i dati, consulta. Preparazione e importazione di dati in blocco con Amazon SageMaker AI Data Wrangler
Ogni record del file CSV deve trovarsi su una sola riga.
Amazon Personalize non supporta tipi di dati complessi come array e mappe.
Per fare in modo che Amazon Personalize utilizzi dati booleani durante l'addestramento o il filtraggio, utilizza valori di stringa e/o valori numerici con valore "False" vero "True" e falso. 1 0
Se usi Data Wrangler per formattare i dati, puoi utilizzare Data Wrangler transform Parse Value as Type per convertire i tipi di dati.
TIMESTAMPe CREATION_TIMESTAMP i dati devono essere in formato UNIX epoch time. Per ulteriori informazioni, consulta Dati relativi al timestamp.
Evita di includere " caratteri o caratteri speciali nei dati dell'ID dell'elemento, dell'ID utente e dell'ID dell'azione.
Se i dati includono caratteri non codificati in formato ASCII, il file CSV deve essere codificato in formato UTF-8.
Assicurati di formattare tutti i dati testuali come descritto in. Metadati di testo non strutturati

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

HRNN-Coldstart

Dati di interazione tra gli articoli