Amazon Machine Learning - Amazon Machine Learning

Non aggiorniamo più il servizio Amazon Machine Learning né accettiamo nuovi utenti. Questa documentazione è disponibile per gli utenti esistenti, ma non la aggiorneremo più. Per ulteriori informazioni, consulta la paginaCos'è Amazon Machine Learning.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Amazon Machine Learning

Questa sezione riepiloga i seguenti concetti fondamentali e descrive in modo più dettagliato come vengono utilizzati all'interno di Amazon ML:

  • Origini daticontengono i metadati associati agli input dei dati relativi ad Amazon ML

  • Modelli ML (modelli ML) generano previsioni utilizzando i modelli estratti dai dati di input

  • Valutazioni valuta la qualità dei modelli ML

  • Previsioni in batch generano in modo asincrono previsioni per più osservazioni di dati di input

  • Previsioni in tempo reale generano in modo sincrono previsioni per singole osservazioni di dati

Origini dati

Un'origine dati è un oggetto che contiene metadata relativi ai dati di input. Amazon ML legge i dati di input, calcola le statistiche descrittive sui rispettivi attributi e memorizza le statistiche, insieme a uno schema e ad altre informazioni, come parte dell'oggetto origine dati. Successivamente Amazon ML utilizza l'origine dati per addestrare e valutare un modello ML e generare previsioni in batch.

Importante

Un'origine dati non archivia una copia dei dati in entrata. Archivia invece un riferimento alla posizione di Amazon S3 in cui si trovano i dati di input. Se si sceglie di spostare o modificare il file di Amazon S3, Amazon ML non può accedervi o utilizzarlo per creare un modello ML, generare valutazioni o generare previsioni.

La tabella seguente definisce i termini correlati alle origini dati.

Termine Definizione
Attributo

Una proprietà denominata univoca all'interno di un'osservazione. Nel caso di dati sotto forma di tabella, come ad esempio fogli di calcolo o file di valori separati da virgola (.csv), le intestazioni delle colonne rappresentano gli attributi e le righe contengono i valori per ogni attributo.

Sinonimi: variabile, nome variabile, campo, colonna

Nome origine dati (facoltativo) consente di definire un nome in formato leggibile per un'origine dati. Questi nomi consentono di individuare e gestire le origini dati nella console di Amazon ML.
Dati di input Nome collettivo per tutte le osservazioni a cui un'origine dati fa riferimento.
Ubicazione Posizione dei dati di input. Al momento, Amazon ML può utilizzare i dati archiviati all'interno dei bucket di Amazon S3, dei database Amazon Redshift, oppure dei database MySQL in Amazon Relational Database Service (RDS).
Osservazione

Una singola unità dei dati di input. Ad esempio, se si crea un modello ML per rilevare transazioni fraudolente, i dati di input saranno costituiti da molte osservazioni, ciascuna delle quali rappresenta una singola transazione.

Sinonimi: record, esempio, istanza, riga

ID riga

(facoltativo) Un flag che, se specificato, identifica un attributo dei dati di input da includere nell'output di previsione. Questo attributo semplifica l'associazione tra una previsione e la corrispondente osservazione.

Sinonimi: identificatore riga

Schema Le informazioni necessarie per interpretare i dati di input, inclusi i nomi degli attributi e i relativi tipi di dati, nonché i nomi degli attributi speciali.
Statistiche

Riepilogo delle statistiche per ogni attributo dei dati di input. Queste statistiche hanno due funzioni:

La console di Amazon ML li visualizza in formato grafico per consentire di comprendere i dati subito e identificare irregolarità o errori.

Amazon ML li utilizza durante il processo di addestramento per migliorare la qualità del modello ML risultante.

Stato Indica lo stato attuale dell'origine dati, ad esempio In Progress (In corso), Completed (Completato) o Failed (Non riuscito).
Attributo di destinazione

Nel contesto dell'addestramento di un modello ML, l'attributo di destinazione identifica il nome dell'attributo nei dati di input che contengono le risposte "corrette". Amazon ML lo utilizza per individuare i pattern dei dati di input e generare un modello ML. Nel contesto della valutazione e generazione delle previsioni, l'attributo di destinazione è l'attributo il cui valore verrà previsto da un modello ML addestrato.

Sinonimi: target

Modelli ML

Un modello ML è un modello matematico in grado di generare previsioni individuando pattern nei dati. Amazon ML supporta tre tipi di modelli ML: di classificazione binaria, di classificazione multiclasse e di regressione.

La tabella seguente definisce i termini correlati ai modelli ML.

Termine Definizione
Regressione L'obiettivo dell'addestramento di un modello ML di regressione è prevedere un valore numerico.
Multiclasse L'obiettivo dell'addestramento di un modello ML multiclasse è prevedere i valori che appartengono a una serie limitata e predefinita di valori consentiti.
Binario L'obiettivo dell'addestramento di un modello ML binario è prevedere i valori che possono avere solo uno di due stati, ad esempio true (vero) o false (falso).
Dimensione del modello I modelli ML acquisiscono e memorizzano pattern. Più sono i pattern memorizzati da un modello ML, maggiori sono le sue dimensioni. La dimensione del modello ML è descritta in Mbyte.
Numero di passate Quando si addestra un modello ML, è possibile utilizzare i dati provenienti da un'origine dati. È talvolta vantaggioso utilizzare ogni record di dati più di una volta nel processo di addestramento. Il numero di volte che si permette ad Amazon ML di usare lo stesso record di dati viene chiamato numero di passate.
Regolarizzazione La regolarizzazione è una tecnica di machine learning che è possibile usare per ottenere modelli di qualità superiore. Amazon ML offre un'impostazione predefinita che funziona ottimamente per la maggior parte dei casi.

Valutazioni

Una valutazione misura la qualità del modello ML e stabilisce se è performante.

La tabella seguente definisce i termini correlati alle valutazioni.

Termine Definizione
Informazioni del modello Amazon ML fornisce un parametro e un numero di informazioni che è possibile utilizzare per valutare le prestazioni predittive del modello.
AUC L'AUC (Area Under the ROC Curve) misura la capacità di un modello ML binario di prevedere un punteggio più elevato per gli esempi positivi rispetto agli esempi negativi.
Punteggio macro-medio F1 Il punteggio macro-medio F1 viene utilizzato per valutare le prestazioni predittive dei modelli ML multiclasse.
RMSE L'RMSE (Root Mean Square Error) è un parametro utilizzato per valutare le prestazioni predittive dei modelli ML di regressione.
Interruzione I modelli ML funzionano generando punteggi di previsioni numeriche. Applicando un valore di interruzione, il sistema converte tali punteggi in etichette 0 e 1.
Accuratezza L'accuratezza misura la percentuale di previsioni corrette.
Precisione La precisione mostra la percentuale di istanze positive effettive (anziché falsi positivi) tra le istanze recuperate (quelle previste come positive). In altre parole, quanti elementi selezionati sono positivi?
Recall Il recall mostra la percentuale di positivi effettivi nel numero totale di istanze pertinenti (positivi effettivi). In altre parole, quanti elementi positivi sono selezionati?

Previsioni in batch

Le previsioni in batch previsioni riguardano un insieme di osservazioni che possono essere eseguite contemporaneamente. È l'ideale per le analisi predittive che non hanno un requisito di tempo reale.

La tabella seguente definisce i termini correlati alle previsioni in batch.

Termine Definizione
Percorso di output I risultati di una previsione in batch sono memorizzati nel percorso di output di un bucket S3.
File manifest Il file manifest si riferisce a ciascun file di dati di input con i relativi risultati della previsione in batch. È memorizzato nel percorso di output del bucket S3.

Previsioni in tempo reale

Le previsioni in tempo reale sono per le applicazioni con un requisito di bassa latenza, ad esempio applicazioni Web interattive, mobili o desktop. È possibile eseguire query relative a previsioni su qualsiasi modello ML utilizzando l'API di previsione in tempo reale a bassa latenza.

La tabella seguente definisce i termini correlati alle previsioni in tempo reale.

Termine Definizione
API di previsione in tempo reale L'API di previsione in tempo reale accetta una sola osservazione di input nel payload della richiesta e restituisce la previsione nella risposta.
Endpoint di previsione in tempo reale Per utilizzare un modello ML con l'API di previsione in tempo reale, è necessario creare un endpoint di previsione in tempo reale. Una volta creato, l'endpoint contiene l'URL utilizzabile per richiedere previsioni in tempo reale.