Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Preparazione dei dati di interazione tra gli elementi per l'addestramento
Un'interazione tra un articolo è un evento di interazione positiva tra un utente e un articolo del tuo catalogo. Ad esempio, un utente che guarda un film, guarda un annuncio o acquista un paio di scarpe. Importi i dati sulle interazioni degli utenti con i tuoi articoli in un set di dati sulle interazioni degli elementi. Puoi registrare diversi tipi di eventi, ad esempio clic, visualizzazione o acquisto.
Ad esempio, se un utente fa clic su un particolare elemento e poi mette «Mi piace» all'elemento, puoi fare in modo che Amazon Personalize utilizzi questi eventi come dati di formazione. Per ogni evento, devi registrare l'ID dell'utente, l'ID dell'elemento, il timestamp (in formato Unix time epoch) e il tipo di evento (click e mi piace). Dovresti quindi aggiungere entrambi gli eventi di interazione tra elementi a un set di dati sulle interazioni tra elementi.
Per tutti i casi d'uso del dominio e le ricette personalizzate, i dati sulle interazioni di massa tra articoli devono essere contenuti in un CSV file. Ogni riga deve rappresentare una singola interazione tra un utente e un elemento. Dopo aver completato la preparazione dei dati, sei pronto per creare un JSON file di schema. Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize.
Le seguenti sezioni forniscono ulteriori informazioni su come preparare i dati di interazione tra gli articoli per Amazon Personalize. Per le linee guida sul formato dei dati in blocco per tutti i tipi di dati, consulta le linee guida sul formato dei dati in blocco
Argomenti
Requisiti in materia di dati di interazione
Le seguenti sezioni elencano i requisiti relativi ai dati di interazione tra gli elementi per Amazon Personalize. Per quote aggiuntive, consulta. Endpoint e quote di Amazon Personalize
Requisiti minimi di formazione
Per tutti i casi d'uso del dominio e le ricette personalizzate, i dati sulle interazioni con articoli in blocco devono contenere quanto segue:
-
Almeno 1000 record di interazioni tra articoli da parte degli utenti che interagiscono con gli articoli del tuo catalogo. Queste interazioni possono derivare da importazioni in blocco, eventi in streaming o entrambi.
-
Almeno 25 utenti unici IDs con almeno due interazioni tra elementi per ciascuno.
Per consigli sulla qualità, ti consigliamo di avere almeno 50.000 interazioni tra articoli da parte di almeno 1.000 utenti con due o più interazioni con gli articoli ciascuna.
Per creare un programma di raccomandazione o una soluzione personalizzata, devi almeno creare un set di dati sulle interazioni con gli articoli.
Requisiti delle colonne
I dati sulle interazioni tra gli articoli devono avere le seguenti colonne.
-
USER_ID: l'identificatore univoco dell'utente che ha interagito con l'elemento. Ogni evento deve avere un _ID. USER Deve essere un
string
con una lunghezza massima di 256 caratteri. -
ITEM_ID: l'identificatore univoco dell'elemento con cui l'utente ha interagito. Ogni evento deve avere un ID articolo. Deve essere un
string
con una lunghezza massima di 256 caratteri. -
TIMESTAMP— L'ora in cui si è verificato l'evento (nel formato Unix Epoch Time in secondi). Ogni interazione deve avere un. TIMESTAMP Per ulteriori informazioni, consulta Dati relativi al timestamp.
-
EVENT_ TYPE — La natura dell'evento di interazione tra oggetti, ad esempio clic, visualizzazione o acquisto. Per i consiglieri di dominio, è necessario disporre di una colonna relativa al tipo di evento e ogni interazione deve avere un tipo di evento. Per tutte le ricette personalizzate, la TYPE colonna EVENT _ è consigliata ma facoltativa. Se la aggiungi, ogni evento deve avere un tipo di evento. Per ulteriori informazioni, consulta Dati sul tipo e sul valore dell'evento.
Sei libero di aggiungere colonne personalizzate aggiuntive a seconda del tuo caso d'uso e dei tuoi dati. Il numero massimo di colonne di metadati opzionali è 5. Queste colonne possono includere valori vuoti/nulli. È consigliabile che queste colonne siano complete almeno al 70 percento.
Dati relativi al timestamp
I dati del timestamp devono essere in formato Unix epoch Time in secondi. Ad esempio, il timestamp Epoch in secondi per la data 31 luglio 2020 è 1596238243. Per convertire le date in timestamp di epoca Unix, usa un convertitore Epoch - Convertitore di timestamp Unix.
Amazon Personalize utilizza i dati di data e ora per calcolare l'attualità e identificare eventuali modelli basati sul tempo. Aiuta Amazon Personalize a mantenere i consigli in linea up-to-date con l'evoluzione delle preferenze degli utenti.
Dati sul tipo e sul valore dell'evento
Un set di dati sulle interazioni tra elementi può memorizzare i dati sul tipo di evento e sul valore dell'evento per ogni interazione. Solo le risorse personalizzate utilizzano i dati sui valori degli eventi.
Dati sul tipo di evento
Il tipo di evento di un'interazione tra elementi fornisce un contesto sulla sua natura e sul suo significato. Alcuni esempi di tipi di evento possono essere click, watch o purchase. Amazon Personalize utilizza dati sul tipo di evento, come i dati su clic o acquisti, per identificare l'intenzione e l'interesse dell'utente. Il numero massimo di tipi di eventi distinti combinato con il numero totale di colonne di metadati opzionali in un set di dati sulle interazioni tra elementi è 10.
Per i consigliatori di dominio, è necessario disporre di una colonna relativa al tipo di evento e ogni interazione deve avere un tipo di evento. Per tutte le ricette personalizzate, la TYPE colonna EVENT _ è consigliata ma facoltativa. Se la aggiungi, ogni evento deve avere un tipo di evento.
Se crei risorse personalizzate, puoi scegliere gli eventi utilizzati per la formazione in base al tipo di evento. Se il tuo set di dati contiene più tipi di eventi in una TYPE colonna EVENT _ e non fornisci un tipo di evento quando configuri una soluzione personalizzata, Amazon Personalize utilizza tutti i dati di interazione tra gli elementi per allenamenti con lo stesso peso indipendentemente dal tipo. Per ulteriori informazioni, consulta Scelta dei dati di interazione tra gli oggetti utilizzati per l'allenamento.
I seguenti casi d'uso hanno requisiti specifici per il tipo di evento:
VIDEOCasi d'uso del DEMAND dominio _ON_
-
Perché hai guardato X richiede almeno 1000
Watch
eventi. -
Il più popolare richiede almeno 1000
Watch
eventi.
ECOMMERCEcasi d'uso del dominio
-
I più visualizzati richiedono almeno 1000
View
eventi. -
I best seller richiedono almeno 1000
Purchase
eventi.
Tipi di eventi positivi e negativi
Amazon Personalize presuppone che qualsiasi interazione sia positiva. Le interazioni con un tipo di evento negativo, come l'antipatia, non impediranno necessariamente all'elemento di apparire nelle raccomandazioni future dell'utente.
Di seguito sono riportati i modi in cui gli eventi negativi e il disinteresse degli utenti influiscono sui consigli:
-
Per tutti i casi d'uso del dominio e per la Personalizzazione dell'utente ricetta, Amazon Personalize può utilizzare i dati sulle impressioni. Quando un elemento appare nei dati sulle impressioni e un utente non lo sceglie, è meno probabile che venga visualizzato nei consigli. Per ulteriori informazioni, consulta Dati sulle impressioni.
-
Se utilizzi risorse personalizzate e importi tipi di eventi positivi e negativi, puoi allenarti solo sui tipi di eventi positivi e poi filtrare gli elementi con cui l'utente ha interagito negativamente. Per ulteriori informazioni, consulta Scelta dei dati di interazione tra gli oggetti utilizzati per l'allenamento e Suggerimenti di filtraggio e segmenti di utenti.
Dati sui valori degli eventi (risorse personalizzate)
I dati sul valore dell'evento possono essere la percentuale di un film guardato da un utente o una valutazione su 10. Se crei soluzioni personalizzate, puoi scegliere i record utilizzati per la formazione in base ai dati nelle VALUE colonne EVENT EVENT _ TYPE e _. Con i consigliatori di dominio, Amazon Personalize non utilizza dati sul valore degli eventi e non puoi filtrare gli eventi prima della formazione.
Per scegliere i record in base al tipo e al valore, registra i dati relativi al tipo e al valore degli eventi. Non tutti gli eventi devono avere un valore di evento. Il valore scelto per ogni evento dipende dai dati che desideri escludere e dai tipi di eventi che stai registrando. Ad esempio, potresti abbinare l'attività dell'utente, ad esempio la percentuale di video che l'utente ha guardato, ai tipi di eventi di visualizzazione.
Quando si configura una soluzione, si imposta un valore specifico come soglia per escludere i record dalla formazione. Ad esempio, se i tuoi VALUE dati EVENT _ per gli eventi con un EVENT _ TYPE of watch sono la percentuale di un video che un utente ha guardato, se imposti la soglia del valore dell'evento su 0,5 e il tipo di evento da guardare, Amazon Personalize addestra il modello utilizzando solo eventi di interazione watch con un EVENT _ VALUE maggiore o uguale a 0,5.
Per ulteriori informazioni, consulta Scelta dei dati di interazione tra gli oggetti utilizzati per l'allenamento
Metadati contestuali
Con determinate ricette e casi d'uso consigliati, Amazon Personalize può utilizzare metadati contestuali per identificare i modelli sottostanti che rivelano gli elementi più pertinenti per i tuoi utenti. I metadati contestuali sono dati sulle interazioni che raccogli nell'ambiente dell'utente al momento di un evento, come la sua posizione o il tipo di dispositivo. Puoi anche specificare il contesto di un utente quando ricevi consigli per l'utente.
Includi metadati contestuali per offrire un'esperienza più personalizzata agli utenti e ridurre la fase di avvio a freddo per i nuovi utenti. La fase di avvio a freddo è quella in cui le raccomandazioni sono meno pertinenti a causa della mancanza di dati storici sugli utenti.
Ad esempio, se il CSV file delle interazioni tra articoli include una TYPE colonna DEVICE _ con tablet
e phone
valori, Amazon Personalize può scoprire in che modo i clienti effettuano acquisti in modo diverso con dispositivi diversi. Quando ricevi consigli per un utente, puoi specificare il suo dispositivo e i consigli saranno più pertinenti, anche se l'utente non ha una cronologia delle interazioni.
Di seguito viene illustrato come formattare un CSV file di interazioni tra elementi con una TYPE colonna DEVICE _ come metadati contestuali.
ITEM_ID,USER_ID,TIMESTAMP,DEVICE_TYPE,EVENT_TYPE shoe12345,12,1428624000,Tablet,CLICK shoe12346,12,1420416000,Tablet,CLICK shoe12347,12,1410652800,Tablet,BUY shoe4444,13,1409961600,Phone,CLICK shoe4445,13,1402876800,Phone,BUY shoe4336,13,1402185600,Phone,CLICK .....
Per i gruppi di set di dati Domain, i seguenti casi d'uso dei consigliatori possono utilizzare metadati contestuali:
-
Consigliato per te(ECOMMERCEdominio)
-
Le migliori scelte per te(dominio VIDEO _ON_DEMAND)
Per le risorse personalizzate, le ricette che utilizzano metadati contestuali includono quanto segue:
Per informazioni sull'inclusione del contesto quando ricevi consigli, consulta. Aumentare la pertinenza delle raccomandazioni con i metadati contestuali Per un esempio completo che mostra come utilizzare i metadati contestuali, consulta quanto segue AWS Post sul blog di Machine Learning: Aumenta la pertinenza dei consigli di Amazon Personalize sfruttando le informazioni contestuali
Dati sulle impressioni
Le impressioni sono elenchi di elementi che erano visibili a un utente quando interagiva con (ad esempio, faceva clic o guardava) un determinato elemento. Se utilizzi un caso d'uso del dominio che fornisce la personalizzazione o la Personalizzazione dell'utente ricetta, Amazon Personalize può utilizzare i dati sulle impressioni per guidare l'esplorazione.
Con l'esplorazione, i consigli includono alcuni elementi o azioni che in genere sarebbero meno propensi a essere consigliati all'utente, come nuovi elementi o azioni, elementi o azioni con poche interazioni o elementi o azioni meno rilevanti per l'utente in base al suo comportamento precedente. Più frequentemente un articolo compare nei dati sulle impressioni, meno è probabile che Amazon Personalize includa l'articolo nell'esplorazione.
Quando crei un programma o una soluzione, Amazon Personalize esclude sempre i dati sulle impressioni dalla formazione. Questo perché Amazon Personalize non addestra i tuoi modelli con dati sulle impressioni. Invece, li utilizza quando ricevi consigli per guidare l'esplorazione per l'utente.
I valori delle impressioni possono contenere al massimo 1000 caratteri (incluso il carattere della barra verticale). Per i gruppi di set di dati Domain, i seguenti casi d'uso consigliati possono utilizzare i dati sulle impressioni:
-
Consigliato per te(dominio) ECOMMERCE
-
Le migliori scelte per te(dominio VIDEO _ON_DEMAND)
Per ulteriori informazioni sull'esplorazione, vedere. Esplorazione Amazon Personalize può modellare due tipi di impressioni: e. Impressioni implicite Impressioni esplicite
Impressioni esplicite
Le impressioni esplicite sono impressioni che registri e invii manualmente ad Amazon Personalize. Usa impressioni esplicite per manipolare i risultati di Amazon Personalize. L'ordine degli articoli non ha alcun impatto.
Ad esempio, potresti avere un'applicazione per lo shopping che fornisce consigli per le scarpe. Se consigli solo scarpe attualmente disponibili, puoi specificare questi articoli utilizzando impressioni esplicite. Il tuo flusso di lavoro di raccomandazione che utilizza impressioni esplicite potrebbe essere il seguente:
-
Richiedi consigli per uno dei tuoi utenti che utilizzano Amazon Personalize GetRecommendationsAPI.
-
Amazon Personalize genera consigli per l'utente che utilizza il tuo modello (versione della soluzione) e li restituisce nella API risposta.
-
Mostri all'utente solo le scarpe consigliate e disponibili in magazzino.
-
Per importare dati incrementali in tempo reale, quando l'utente interagisce con (ad esempio, facendo clic) con un paio di scarpe, si registra la scelta in una chiamata a PutEvents API e nel parametro vengono elencati gli articoli consigliati disponibili in magazzino.
impression
Per un esempio di codice, consulta. Registrazione degli eventi di interazione tra gli elementi con i dati delle impressioniPer importare le impressioni nei dati storici sulle interazioni tra elementi, puoi elencare le impressioni esplicite nel tuo file csv e separare ogni elemento con un carattere '|'. Il carattere della barra verticale viene conteggiato fino al limite di 1000 caratteri. Per un esempio, consulta Formattazione di impressioni esplicite.
-
Amazon Personalize utilizza i dati sulle impressioni per guidare l'esplorazione, mentre le raccomandazioni future includono scarpe nuove con meno interazioni, dati o rilevanza.
Formattazione di impressioni esplicite
Per includere impressioni esplicite nel CSV file, aggiungi una colonna. IMPRESSION Per ogni interazione tra elementi, aggiungi un elenco di itemIds caratteri separati da una barra verticale, '|'. Il carattere della barra verticale viene conteggiato ai fini del limite di 1000 caratteri per i dati sulle impressioni. Se si includono impressioni esplicite durante il PutEvents funzionamento, si specificano gli elementi in una matrice di stringhe.
Di seguito è riportato un breve estratto da un CSV file che include impressioni esplicite nella colonna. IMPRESSION
EVENT_TYPE | IMPRESSION | ITEM_ID | TIMESTAMP | USER_ID |
---|---|---|---|---|
clicca |
73|70|17|95|96 |
73 |
1586731606 |
USER_1 |
clicca |
35|82|78|57|20|63|1|90|76|75|49|71|26|24|25|6 |
35 |
1586735164 |
USER_2 |
... | ... | ... | ... | ... |
L'applicazione mostrava USER_1
gli elementi utente73
,70
, 17
95
, 96
e alla fine l'utente ha scelto l'elemento73
. Quando si crea una nuova versione della soluzione basata su questi dati70
, gli elementi 17
95
,, 96
verranno consigliati all'utente meno frequentementeUSER_1
.
Impressioni implicite
Le impressioni implicite sono i consigli, recuperati da Amazon Personalize, che mostri all'utente. Non è necessario che il CSV file includa colonne IMPRESSION o RECOMMENDATION _ID per utilizzare le impressioni implicite. Invece, includi RecommendationId
(restituito da GetRecommendations and GetPersonalizedRanking operations) nelle richieste. PutEvents Amazon Personalize ricava le impressioni implicite in base ai dati delle tue raccomandazioni.
Ad esempio, potresti avere un'applicazione che fornisce consigli per lo streaming di video. Il flusso di lavoro di raccomandazione che utilizza le impressioni implicite potrebbe essere il seguente:
-
Richiedi consigli video per uno dei tuoi utenti utilizzando l'operazione Amazon Personalize GetRecommendationsAPI.
-
Amazon Personalize genera consigli per l'utente che utilizza il tuo modello (versione della soluzione) e li restituisce con una
recommendationId
nella API risposta. -
I video consigliati all'utente vengono mostrati nell'applicazione.
-
Quando l'utente interagisce con un video (ad esempio facendo clic), registra la scelta in una chiamata a PutEvents API e includila
recommendationId
come parametro. Per un esempio di codice, consulta. Registrazione degli eventi di interazione tra gli elementi con i dati delle impressioni -
Amazon Personalize utilizza il
recommendationId
per ricavare i dati sulle impressioni dai consigli video precedenti, quindi utilizza i dati sulle impressioni per guidare l'esplorazione, laddove i consigli futuri includono nuovi video con meno dati o rilevanza sulle interazioni.Per ulteriori informazioni sulla registrazione di eventi con dati impliciti sulle impressioni, consulta. Registrazione degli eventi di interazione tra gli elementi con i dati delle impressioni
Esempio di dati sulle interazioni
I seguenti dati sulle interazioni rappresentano l'attività storica degli utenti da un sito Web di streaming video. Puoi utilizzare i dati per addestrare un modello che fornisca consigli sui film basati sui dati di interazione degli utenti. Nota che alcuni valori per EVENT _ VALUE sono nulli.
USER_ID,ITEM_ID,EVENT_TYPE,EVENT_VALUE,TIMESTAMP 196,242,watch,.50,881250949 186,302,watch,.75,891717742 22,377,click,,878887116 244,51,click,,880606923 166,346,watch,.50,886397596 298,474,watch,.25,884182806 115,265,click,,881171488 253,465,watch,.50,891628467 305,451,watch,.75,886324817
Amazon Personalize richiede la colonna USER_ID
ITEM_ID
, eTIMESTAMP
. USER_ID
è l'identificatore di un utente della tua applicazione. ITEM_ID
è l'identificatore di un film. EVENT_TYPE
e EVENT_VALUE
sono gli identificatori per le interazioni degli utenti. Nei dati di esempio, gli eventi sono watch
e click
gli eventi e i valori sono la percentuale di un video guardato da un utente. TIMESTAMP
Rappresenta l'epoca Unix in cui è avvenuto l'acquisto del film.
Dopo aver completato la preparazione dei dati, si è pronti per creare un file di schemaJSON. Questo file indica ad Amazon Personalize la struttura dei tuoi dati. Per ulteriori informazioni, consulta Creazione di JSON file di schema per schemi Amazon Personalize. Ecco come apparirebbe il JSON file di schema per i dati di esempio.
{ "type": "record", "name": "Interactions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "USER_ID", "type": "string" }, { "name": "ITEM_ID", "type": "string" }, { "name": "EVENT_TYPE", "type": "string" }, { "name": "EVENT_VALUE", "type": "float" }, { "name": "TIMESTAMP", "type": "long" } ], "version": "1.0" }