Previsioni delle serie temporali in Amazon Canvas SageMaker - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Previsioni delle serie temporali in Amazon Canvas SageMaker

Nota

I modelli di previsione di serie temporali sono supportati solo per set di dati tabellari.

Amazon SageMaker Canvas ti offre la possibilità di utilizzare previsioni di serie temporali basate sull'apprendimento automatico. Le previsioni di serie temporali offrono la possibilità di generare previsioni che possono variare nel tempo.

Puoi fare una previsione di serie temporale per i seguenti esempi:

  • Previsione del tuo inventario nei prossimi mesi.

  • Numero di articoli venduti nei prossimi quattro mesi.

  • Effetto della riduzione del prezzo sulle vendite durante le festività natalizie.

  • Inventario degli articoli nei 12 mesi successivi.

  • Numero di clienti che entrano in un negozio nelle prossime ore.

  • Previsione di come una riduzione del 10% del prezzo di un prodotto influenzi le vendite in un dato periodo di tempo.

Per fare una previsione di serie temporali, il set di dati deve avere quanto segue:

  • Una colonna di timestamp in cui tutti i valori sono di tipo datetime.

  • Una colonna di destinazione che contiene i valori che usi per prevedere i valori futuri.

  • Una colonna con l'ID dell'articolo che contiene identificatori univoci per ogni elemento del set di dati, ad esempio numeri. SKU

I valori datetime nella colonna di timestamp devono utilizzare uno dei seguenti formati:

  • YYYY-MM-DD HH:MM:SS

  • YYYY-MM-DDTHH:MM:SSZ

  • YYYY-MM-DD

  • MM/DD/YY

  • MM/DD/YY HH:MM

  • MM/DD/YYYY

  • YYYY/MM/DD HH:MM:SS

  • YYYY/MM/DD

  • DD/MM/YYYY

  • DD/MM/YY

  • DD-MM-YY

  • DD-MM-YYYY

Puoi fare previsioni per i seguenti intervalli:

  • 1 minuto

  • 5 minuti

  • 15 minuti

  • 30 minuti

  • 1 ora

  • 1 giorno

  • 1 settimana

  • 1 mese

  • 1 anno

Valori futuri nel tuo set di dati di input

Canvas rileva automaticamente le colonne nel set di dati che potrebbero potenzialmente contenere valori futuri. Se presenti, questi valori possono migliorare l'accuratezza delle previsioni. Canvas contrassegna queste colonne specifiche con un'etichetta Future values. Canvas inferisce la relazione tra i dati in queste colonne e la colonna di destinazione che stai cercando di prevedere e utilizza tale relazione per generare previsioni più accurate.

Ad esempio, puoi prevedere la quantità di gelati venduti da un negozio di alimentari. Per fare una previsione, è necessario disporre di una colonna di timestamp e di una colonna che indichi la quantità di gelato venduta dal negozio di alimentari. Per una previsione più accurata, il set di dati può includere anche il prezzo, la temperatura ambiente, il gusto del gelato o un identificatore univoco per il gelato.

Le vendite di gelati potrebbero aumentare quando il clima è più caldo. Una diminuzione del prezzo del gelato potrebbe comportare un aumento delle unità vendute. Avere una colonna con i dati sulla temperatura ambiente e una colonna con i dati sui prezzi può migliorare la capacità di prevedere il numero di unità di gelato vendute dal negozio di alimentari.

Sebbene fornire valori futuri sia facoltativo, aiuta a eseguire analisi condizionali direttamente nell'applicazione Canvas, mostrandoti come le modifiche ai valori futuri potrebbero alterare le tue previsioni.

Gestione dei valori mancanti

Potresti avere dei dati mancanti per diversi motivi. Il motivo dei dati mancanti potrebbe indicare il modo in cui desideri che Canvas li attribuisca. Ad esempio, la tua organizzazione potrebbe utilizzare un sistema automatico che tiene traccia solo di quando avviene una vendita. Se utilizzi un set di dati proveniente da questo tipo di sistema automatico, nella colonna di destinazione mancheranno dei valori.

Importante

Se nella colonna di destinazione mancano dei valori, ti consigliamo di utilizzare un set di dati che non li contenga. SageMaker Canvas utilizza la colonna di destinazione per prevedere i valori futuri. I valori mancanti nella colonna di destinazione possono ridurre notevolmente l'accuratezza della previsione.

Per i valori mancanti nel set di dati, Canvas attribuisce automaticamente i valori mancanti, riempiendo la colonna di destinazione con 0 e le altre colonne numeriche con il valore mediano della colonna.

Tuttavia, puoi selezionare la tua logica di riempimento per la colonna di destinazione e altre colonne numeriche nei tuoi set di dati. Le colonne di destinazione hanno linee guida e restrizioni di riempimento diverse rispetto al resto delle colonne numeriche. Le colonne di destinazione vengono riempite fino alla fine del periodo storico, mentre le colonne numeriche vengono riempite sia nei periodi storici che in quelli futuri, fino alla fine dell'orizzonte di previsione. Canvas inserisce i valori futuri in una colonna numerica solo se i dati hanno almeno una voce con un timestamp futuro e un valore per quella colonna specifica.

Puoi scegliere una delle seguenti opzioni della logica di riempimento per attribuire i valori mancanti nei tuoi dati:

  • zero: riempi con 0.

  • NaN: riempi con NaN o non con un numero. Questo è supportato solo per la colonna di destinazione.

  • mean: riempi con il valore medio dalla serie di dati.

  • median: riempi con il valore mediano dalla serie di dati.

  • min: riempi con il valore minimo dalla serie di dati.

  • max: riempi con il valore massimo dalla serie di dati.

Quando scegli una logica di riempimento, devi considerare come la logica verrà interpretata dal modello. Ad esempio, in uno scenario di vendita al dettaglio, registrare zero vendite per un articolo disponibile è diverso rispetto a registrare zero vendite di un articolo non disponibile, in quanto quest'ultima condizione non implica una mancanza di interesse del cliente per l'articolo. In questo caso, il riempimento con 0 nella colonna di destinazione del set di dati potrebbe far sì che il modello sia meno preciso nelle sue previsioni e inferisca uno scarso interesse da parte dei clienti per gli articoli non disponibili. Al contrario, il riempimento con NaN potrebbe far sì che il modello ignori le occorrenze reali di zero articoli venduti tra gli articoli disponibili.

Tipi di previsioni

Puoi creare uno dei seguenti tipi di previsioni:

  • Elemento singolo

  • Tutti gli elementi

Per una previsione su tutti gli elementi del set di dati, SageMaker Canvas restituisce una previsione per i valori futuri per ogni elemento del set di dati.

Per una previsione a singolo articolo, si specifica l'articolo e SageMaker Canvas restituisce una previsione per i valori futuri. La previsione include un grafico a linee che riporta i valori previsti nel tempo.