Ricetta SIMS - Amazon Personalize

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Ricetta SIMS

Nota

Tutte le ricette RELATED_ITEMS utilizzano dati di interazione. Scegliete SIMS se desiderate configurare più iperparametri per il modello. Scegli Ricetta Similar-Items se disponi di metadati degli articoli e desideri che Amazon Personalize li utilizzi per trovare articoli simili.

La ricetta I tem-to-item similarity (SIMS) utilizza il filtro collaborativo per consigliare gli articoli più simili a un articolo specificato quando ricevi consigli. SIMS utilizza il set di dati sulle interazioni degli articoli, non i metadati degli articoli come il colore o il prezzo, per determinare la somiglianza. SIMS identifica la co-occorrenza dell'elemento nelle cronologie degli utenti nel set di dati di interazione per consigliare elementi simili. Ad esempio, con SIMS Amazon Personalize potrebbe consigliare articoli da caffetteria che i clienti comprano spesso insieme o film guardati anche da utenti diversi.

Quando ricevi consigli su articoli simili, puoi filtrare gli articoli in base a un attributo dell'articolo specificato nella richiesta. Puoi farlo aggiungendo unCurrentItem. attributeelemento al tuo filtro. Per vedere un esempio, consulta item data filter examples.

Per utilizzare SIMS, è necessario creare un set di dati sulle interazioni tra elementi con almeno 1000 interazioni storiche ed eventi uniche (combinate). SIMS non utilizza i dati in un set di dati Users o Items per generare consigli. Puoi comunque filtrare i consigli in base ai dati contenuti in questi set di dati. Per ulteriori informazioni, consulta Suggerimenti di filtraggio e segmenti di utenti.

Se non ci sono dati sufficienti sul comportamento degli utenti per un elemento o l'ID dell'elemento fornito non viene trovato, SIMS consiglia gli articoli più diffusi. Dopo aver creato una versione della soluzione, assicurati di mantenere aggiornati la versione e i dati della soluzione. Con SIMS, devi creare manualmente una nuova versione della soluzione (riqualificare il modello) per consentire ad Amazon Personalize di prendere in considerazione nuovi elementi da suggerire e aggiornare il modello con il comportamento più recente dell'utente. Quindi devi aggiornare qualsiasi campagna utilizzando la versione della soluzione. Per ulteriori informazioni, consulta Mantenere la pertinenza delle raccomandazioni.

La ricetta SIMS ha le seguenti proprietà:

  • Nome: aws-sims

  • Ricetta Amazon Resource Name (ARN) — arn:aws:personalize:::recipe/aws-sims

  • Algoritmo ARNarn:aws:personalize:::algorithm/aws-sims

  • ARN per la trasformazione delle funzionalitàarn:aws:personalize:::feature-transformation/sims

  • Tipo di ricettaRELATED_ITEMS

La tabella seguente descrive gli iperparametri per la ricetta SIMS. Un iperparametro è un parametro di algoritmo che puoi regolare per migliorare le prestazioni del modello. Gli iperparametri dell'algoritmo controllano le prestazioni del modello. Gli iperparametri di funzionalità controllano come filtrare i dati da utilizzare nel training. Il processo di scelta del valore migliore per un iperparametro è chiamato ottimizzazione iperparametri (HPO). Per ulteriori informazioni, consulta Iperparametri e HPO.

La tabella fornisce inoltre le seguenti informazioni per ogni iperparametro:

  • Range: [limite inferiore, limite superiore]

  • Value type: Integer, Continuous (float), Categorical (booleano, elenco, stringa)

  • HPO tunable: il parametro può partecipare all’ottimizzazione degli iperparametri (HPO)?

Nome Descrizione
Iperparametri dell'algoritmo
popularity_discount_factor

Configura in che modo la popolarità influenza i consigli. Specificate un valore più vicino allo zero per includere gli articoli più popolari. Specificate un valore più vicino a uno per una minore enfasi sulla popolarità.

Valore predefinito: 0.5

Intervallo: [0.0, 1.0]

Tipo di valore: float

HPO regolabile: sì

min_cointeraction_count

Il numero minimo di co-interazioni necessarie per calcolare la somiglianza tra una coppia di item. Ad esempio, il valore 3 indica che sono necessari tre o più utenti che interagiscono con entrambi gli item per consentire all'algoritmo di calcolare la somiglianza.

Valore predefinito: 3

Intervallo: [0, 10].

Tipo di valore: Integer

HPO regolabile: sì

Iperparametri di caratterizzazione
min_user_history_length_percentile

Il percentile minimo delle lunghezze della cronologia degli utenti da includere nell’addestramento del modello. La lunghezza della cronologia è la quantità totale di dati disponibili su un utente. Utilizza min_user_history_length_percentile per escludere una percentuale di utenti con brevi periodi di cronologia. Gli utenti con una breve cronologia spesso mostrano modelli basati sulla popolarità dell'articolo anziché le esigenze o i desideri personali dell'utente. La loro rimozione può addestrare modelli con maggiore attenzione sui modelli sottostanti nei dati. Scegli un valore appropriato dopo aver esaminato le lunghezze della cronologia degli utenti, utilizzando un istogramma o uno strumento simile. Ti consigliamo di impostare un valore che conservi la maggior parte degli utenti, ma rimuove i casi limite.

Valore predefinito: 0.005

Intervallo: [0.0, 1.0]

Tipo di valore: float

HPO regolabile: no

max_user_history_length_percentile

Il percentile massimo delle lunghezze della cronologia degli utenti da includere nell’addestramento del modello. La lunghezza della cronologia è la quantità totale di dati disponibili su un utente. Utilizza max_user_history_length_percentile per escludere una percentuale di utenti con lunghi periodi di cronologia. Gli utenti con una lunga cronologia tendono a contenere rumore. Ad esempio, un robot potrebbe avere un lungo elenco di interazioni automatizzate. La rimozione di questi utenti limita il rumore durante il training. Scegli un valore appropriato dopo aver esaminato le lunghezze della cronologia degli utenti utilizzando un istogramma o uno strumento simile. Ti consigliamo di impostare un valore che conservi la maggior parte degli utenti ma rimuove i casi limite.

Ad esempio, min_hist_length_percentile = 0.05 e max_hist_length_percentile = 0.95 includono tutti gli utenti tranne quelli con lunghezze della cronologia nella parte inferiore o superiore del 5%.

Valore predefinito: 0,995

Intervallo: [0.0, 1.0]

Tipo di valore: float

HPO regolabile: no

min_item_interaction_count_percentile

Il percentile minimo del conteggio delle interazioni degli elementi da includere nell’addestramento del modello. Utilizza min_item_interaction_count_percentile per escludere una percentuale di item con una breve cronologia delle interazioni. Gli item con una breve cronologia spesso sono nuovi elementi. La loro rimozione può addestrare modelli con maggiore attenzione agli elementi con una cronologia nota. Scegli un valore appropriato dopo aver esaminato le lunghezze della cronologia degli utenti, utilizzando un istogramma o uno strumento simile. Ti consigliamo di impostare un valore che conserva la maggior parte degli item, ma rimuove i casi limite.

Valore predefinito: 0,01

Intervallo: [0.0, 1.0]

Tipo di valore: float

HPO regolabile: no

max_item_interaction_count_percentile

Il numero massimo di percentile di elemento interazione conteggia di includere nel modello di formazione. Utilizza max_item_interaction_count_percentile per escludere una percentuale di item con una lunga cronologia delle interazioni. Gli elementi con una lunga cronologia tendono a essere più vecchi e potrebbero essere obsoleti. Ad esempio, una release di film non disponibile. La rimozione di questi elementi può concentrarsi su elementi più rilevanti. Scegli un valore appropriato dopo aver esaminato le lunghezze della cronologia degli utenti utilizzando un istogramma o uno strumento simile. Ti consigliamo di impostare un valore che conserva la maggior parte degli item ma rimuove i casi limite.

Ad esempio, min_item_interaction_count_percentile = 0.05 e max_item_interaction_count_percentile = 0.95 includono tutti gli item tranne quelli con un conteggio delle interazioni nella parte inferiore o nel primo 5%.

Valore predefinito: 0,9

Intervallo: [0.0, 1.0]

Tipo di valore: float

HPO regolabile: no

Notebook di esempio SIMS

Per un notebook Jupyter di esempio che mostra come utilizzare la ricetta SIMS, consulta Finding Similar Items + HPO.