Set di dati e schemi personalizzati - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Set di dati e schemi personalizzati

Quando crei un gruppo di set di dati personalizzato, crei i tuoi schemi da zero. I set di dati e gli schemi di gruppi di dati personalizzati hanno meno campi obbligatori e maggiore flessibilità. I seguenti argomenti spiegano lo schema e i requisiti di dati per i set di dati (un gruppo di set di dati personalizzato). Ogni sezione del set di dati elenca i dati richiesti per il tipo di set di dati e fornisce un JSON esempio di schema.

Per informazioni sui tipi di dati che puoi importare in Amazon Personalize, consulta. Tipi di dati che Amazon Personalize può utilizzare Per informazioni sui requisiti generali dello schema di Amazon Personalize, come i requisiti di formattazione e i tipi di dati di campo disponibili, consulta. Creazione di JSON file di schema per schemi Amazon Personalize Questi requisiti si applicano a tutti gli schemi Amazon Personalize.

Requisiti per set di dati e schemi personalizzati

Quando si crea un set di dati per un gruppo di set di dati personalizzato, ogni tipo di set di dati presenta i seguenti campi obbligatori e parole chiave riservate con tipi di dati obbligatori.

Tipo di set di dati Campi obbligatori Parole chiave riservate
Interazioni tra elementi (esempio di schema)

USER_ID () string

ITEM_ID () string

TIMESTAMP (long)

EVENT_TYPE (string)

EVENT_VALUE (float, null)

IMPRESSION (string, null)

RECOMMENDATION_ID (,) string null

EVENT_ATTRIBUTION_SOURCE (string, null)

Utenti (esempio di schema)

USER_ID () string

1 campo di metadati (categorico o numericostring)

Elementi (esempio di schema)

ITEM_ID () string

1 campo di metadati (campo categorico o testuale o string campo numerico)

CREATION_TIMESTAMP (long)

Azioni (esempio di schema)

ACTION_ID () string

1 campo di metadati (categorico o numericostring)

CREATION_TIMESTAMP (long)

VALUE (long, null)

TYPE (string, null)

EXPIRATION_TIMESTAMP (long, null)

REPEAT_FREQUENCY (long, null)

Interazioni di azione (esempio di schema)

USER_ID () string

ACTION_ID () string

EVENT_TYPE (string)

TIMESTAMP (long)

IMPRESSION (string, null)

RECOMMENDATION_ID (,) string null

Campi di metadati

I metadati includono campi stringhe o non stringhe che non sono obbligatori o che non utilizzano una parola chiave riservata. Gli schemi di metadati presentano le seguenti restrizioni:

  • Gli schemi Users, Items e Actions richiedono almeno un campo di metadati.

  • È possibile aggiungere al massimo 25 campi di metadati per uno schema Users, 100 campi di metadati per uno schema Items e 10 campi di metadati per uno schema Actions.

  • Se aggiungi il tuo campo di metadati di tipo personalestring, questo deve includere l'categoricalattributo o l'attributo (solo gli schemi Items supportano i campi con l'textualattributo testuale). Altrimenti, Amazon Personalize non utilizzerà il campo durante l'addestramento di un modello.

Parole chiave riservate

Le parole chiave riservate sono campi facoltativi, non contenenti metadati. Questi campi sono considerati riservati perché è necessario definire i campi come tipo di dati obbligatorio quando li si utilizza e le parole chiave non possono essere utilizzate come valori nei dati. I campi stringa categorici riservati devono essere categorical impostati sutrue, mentre i campi stringa riservati non possono essere categorici. Le seguenti sono parole chiave riservate:

  • EVENT_TYPE: per i set di dati sulle interazioni tra elementi con uno o più tipi di eventi, ad esempio clic e download, utilizza un EVENT_TYPE campo. È necessario definire un TYPE campo EVENT _ come un campo string e non può essere impostato come categorico.

  • EVENT_VALUE: per i set di dati sulle interazioni tra elementi che includono dati di valore per gli eventi, come la percentuale di un video guardato da un utente, utilizza un EVENT_VALUE campo con tipo float e facoltativamente. null

  • CREATION_TIMESTAMP: per i set di dati Items o Actions con un timestamp per la data di creazione di ogni elemento, utilizza un campo con un CREATION_TIMESTAMP tipo. long Amazon Personalize utilizza i CREATION_TIMESTAMP dati per calcolare l'età di un articolo e modificare i consigli di conseguenza. Per informazioni, consulta Dati relativi al timestamp di creazione.

  • IMPRESSION: per i set di dati sulle interazioni tra articoli con dati espliciti sulle impressioni, utilizza un IMPRESSION campo con tipo e, facoltativamente, tipoString. null Le impressioni sono elenchi di elementi che erano visibili a un utente quando interagiva con (ad esempio, faceva clic o guardava) un particolare elemento. Per ulteriori informazioni, consulta Dati sulle impressioni.

  • RECOMMENDATION_ID: per i set di dati sulle interazioni tra elementi che utilizzano consigli precedenti come dati impliciti sulle impressioni, utilizza facoltativamente un campo con tipo e facoltativamente tipo. RECOMMENDATION_ID String null

    Non è necessario aggiungere un RECOMMENDATION_ID campo per Amazon Personalize per utilizzare le impressioni implicite durante la generazione di consigli. Puoi eseguire un'PutEventsoperazione senza recommendationId di essa. Per ulteriori informazioni, consulta Dati sulle impressioni.

  • VALUE: Per i set di dati Actions, se disponi di dati validi per alcune o tutte le tue azioni, aggiungi un VALUE campo allo schema. Per il tipo, usa long e, facoltativamente, digita. null Per ulteriori informazioni sulle azioni e sul loro valore, vedereValue data (Dati valore).

  • ACTION_ EXPIRATION _TIMESTAMP: Per i set di dati Actions, se hai un timestamp di scadenza per alcune o tutte le tue azioni, aggiungi un ACTION_EXPIRATION_TIMESTAMP campo allo schema. Per il tipo, usa long e, facoltativamente, digita. null Per ulteriori informazioni sui timestamp di scadenza, vedere. Dati relativi al timestamp di scadenza dell'azione

  • REPEAT_FREQUENCY: Per i set di dati Actions, se disponi di dati sulla frequenza di ripetizione per alcune o tutte le tue azioni, aggiungi un REPEAT_FREQUENCY campo allo schema. Per il tipo, usa long e, facoltativamente, digita. null Per ulteriori informazioni sui dati relativi alla frequenza di ripetizione, vedereRipeti i dati sulla frequenza.