Preparazione dei metadati utente per la formazione - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Preparazione dei metadati utente per la formazione

I dati utente che puoi importare in Amazon Personalize includono dati numerici, come l'età dell'utente, e metadati categoriali, come il sesso o l'iscrizione al programma fedeltà. Importi i metadati sui tuoi utenti in un set di dati Amazon Personalize Users.

A seconda del caso d'uso del dominio o della ricetta personalizzata, i metadati utente possono aiutare Amazon Personalize a consigliare articoli più pertinenti agli utenti o a consigliare segmenti di utenti più significativi. E dopo l'addestramento, può aiutare il tuo modello a consigliare elementi per gli utenti senza dati sulle interazioni. Per ulteriori informazioni su quali casi d'uso o ricette utilizzano i metadati degli utenti, consulta i requisiti in materia di dati per il caso d'uso o la ricetta del dominio inAdattamento del tuo caso d'uso alle risorse di Amazon Personalize.

Durante la formazione, Amazon Personalize non utilizza stringhe di dati utente non categoriali, come nomi utente, parole chiave sull'utente o tag. Tuttavia, l'importazione di questi dati può comunque migliorare i consigli. Per ulteriori informazioni, consulta Dati di stringa non categoriali.

Per tutti i casi d'uso del dominio e le ricette personalizzate, i dati utente in blocco devono essere contenuti in un CSV file. Ogni riga del file deve rappresentare un utente unico. Dopo aver completato la preparazione dei dati, sei pronto per creare un JSON file di schema. Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize.

Le seguenti sezioni forniscono ulteriori informazioni su come preparare i dati utente per Amazon Personalize. Per le linee guida sul formato dei dati in blocco per tutti i tipi di dati, consulta le linee guida sul formato dei dati in blocco

Requisiti relativi ai dati utente

Di seguito sono riportati i requisiti relativi ai dati utente per Amazon Personalize. Sei libero di aggiungere colonne personalizzate aggiuntive a seconda del tuo caso d'uso e dei tuoi dati.

  • I tuoi dati devono avere una colonna USER _ID che memorizza l'identificatore univoco per ogni utente. Ogni utente deve avere un ID utente. Deve essere un string con una lunghezza massima di 256 caratteri.

  • I dati devono avere almeno una stringa categorica o una colonna di metadati numerici. Le colonne di metadati utente possono includere valori vuoti/nulli per alcuni utenti. È consigliabile che queste colonne siano complete almeno al 70%.

  • Il numero massimo di colonne di metadati è 25.

Se non sei sicuro di disporre di dati sufficienti o se hai domande sulla loro qualità, puoi importare i dati in un set di dati Amazon Personalize e utilizzare Amazon Personalize per analizzarli. Per ulteriori informazioni, consulta Analisi della qualità e della quantità di dati nei set di dati di Amazon Personalize.

Metadati categoriali

Con alcune ricette e tutti i casi d'uso del dominio, Amazon Personalize utilizza metadati categoriali, come il sesso, gli interessi o lo stato di iscrizione dell'utente, per identificare i modelli sottostanti che rivelano gli elementi più pertinenti per i tuoi utenti. Puoi definire il tuo intervallo di valori in base al tuo caso d'uso. I metadati categoriali possono essere in qualsiasi lingua.

Per gli utenti con più categorie, separa ogni valore con la barra verticale '|'. Ad esempio, per un INTERESTS campo, i tuoi dati per un utente potrebbero essere. Movies|TV Shows|Music

Con tutte le ricette e i domini, puoi importare metadati categorici e utilizzarli per filtrare i consigli in base agli attributi di un utente. Per informazioni sui consigli di filtraggio, consulta. Suggerimenti di filtraggio e segmenti di utenti

I valori categoriali possono contenere al massimo 1000 caratteri. Se hai un utente con un valore categorico con più di 1000 caratteri, il processo di importazione del set di dati avrà esito negativo.

Dati di stringa non categoriali

Ad eccezione dell'utenteIDs, Amazon Personalize non utilizza dati di stringa non categoriali durante la formazione, come nomi utente, parole chiave sull'utente o tag. Tuttavia, Amazon Personalize può utilizzarlo per filtrare i consigli. Puoi creare filtri per includere o rimuovere elementi dai consigli in base a stringhe di dati non categoriali relativi all'utente per il quale stai ricevendo i consigli. CurrentUser Per ulteriori informazioni sui filtri, consultare Suggerimenti di filtraggio e segmenti di utenti. I valori non categoriali possono contenere un massimo di 1000 caratteri.

Esempio di metadati per gli utenti

Le prime righe di metadati utente in un CSV file potrebbero essere simili alle seguenti.

USER_ID,AGE,GENDER,INTEREST 5,34,Male,hiking 6,56,Female,music 8,65,Male,movies|TV shows|music ... ...

La USER_ID colonna è obbligatoria e memorizza identificatori univoci per ogni singolo utente. La AGE colonna è costituita da metadati numerici. Le INTEREST colonne GENDER e memorizzano i metadati categorici per ogni utente.

Dopo aver completato la preparazione dei dati, sei pronto per creare un file di schemaJSON. Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize. Ecco come apparirebbe il JSON file di schema per i dati di esempio sopra riportati.

{ "type": "record", "name": "Users", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "AGE", "type": "int" }, { "name": "GENDER", "type": "string", "categorical": true }, { "name": "INTEREST", "type": "string", "categorical": true } ], "version": "1.0" }