Modelli e addestramento dei modelli in Amazon Neptune ML

Modalità Focus

Modelli e addestramento dei modelli in Amazon Neptune ML - Amazon Neptune

Reti neurali a grafo Formazione GNNs Modelli di incorporamento del grafo della conoscenza Modelli personalizzati

Neptune ML utilizza reti neurali a grafo (GNN) per creare modelli per le varie attività di machine learning. È stato dimostrato che le reti neurali grafiche ottengono state-of-the-art risultati per le attività di apprendimento automatico dei grafi e sono eccellenti nell'estrarre modelli informativi da dati strutturati a grafi.

Reti neurali grafiche (GNNs) in Neptune ML

Le reti neurali a grafo (GNNs) appartengono a una famiglia di reti neurali che calcolano le rappresentazioni dei nodi tenendo conto della struttura e delle caratteristiche dei nodi vicini. GNNs integrano altri metodi tradizionali di apprendimento automatico e di rete neurale che non sono adatti per i dati grafici.

GNNs vengono utilizzati per risolvere attività di apprendimento automatico come la classificazione e la regressione dei nodi (previsione delle proprietà dei nodi), la classificazione e la regressione dei bordi (previsione delle proprietà degli spigoli) o la previsione dei link (previsione della connessione o meno di due nodi del grafico).

In generale, l'utilizzo di una GNN per un'attività di machine learning prevede due fasi:

Una fase di codifica, in cui la GNN calcola un vettore d-dimensionale per ogni nodo del grafo. Questi vettori sono anche chiamati rappresentazioni o incorporamenti.
Una fase di decodifica, che effettua previsioni basate sulle rappresentazioni codificate.

Per la classificazione e la regressione dei nodi, le rappresentazioni dei nodi vengono utilizzate direttamente per le attività di classificazione e regressione. Per la classificazione e la regressione degli archi, le rappresentazioni dei nodi incidenti su un arco vengono utilizzate come input per la classificazione o la regressione. Per la previsione dei collegamenti, viene calcolato un punteggio di probabilità degli archi utilizzando una coppia di rappresentazioni di nodi e una rappresentazione del tipo di arco.

La Deep Graph Library (DGL) facilita la definizione e la formazione efficienti di queste attività. GNNs

Diversi modelli di GNN sono unificati sotto la formulazione del passaggio dei messaggi. Da questo punto di vista, la rappresentazione di un nodo in un grafo viene calcolata utilizzando le rappresentazioni dei vicini del nodo (i messaggi), insieme alla rappresentazione iniziale del nodo. In Neptune ML la rappresentazione iniziale di un nodo deriva dalle funzionalità estratte dalle proprietà del nodo oppure è apprendibile e dipende dall'identità del nodo.

Neptune ML consente inoltre di concatenare le funzionalità dei nodi e le rappresentazioni dei nodi apprendibili per fungere da rappresentazione del nodo originale.

Per le varie attività di Neptune ML che coinvolgono grafi con proprietà dei nodi, viene usata la rete Relational Graph Convolutional Network (R-GCN) per eseguire la fase di codifica. La R-GCN è un'architettura GNN adatta per i grafi con più tipi di nodi e archi (noti come grafi eterogenei).

La rete R-GCN è costituita da un numero fisso di livelli, impilati uno dopo l'altro. Ogni livello della rete R-GCN utilizza i relativi parametri del modello apprendibili per aggregare informazioni dal neighborhood a 1 hop di un nodo. Poiché i livelli successivi utilizzano le rappresentazioni di output del livello precedente come input, il raggio del neighborhood del grafo che influenza l'incorporamento finale di un nodo dipende dal numero di livelli (num-layer) della rete R-GCN.

Questo significa ad esempio che una rete a 2 livelli utilizza le informazioni provenienti da nodi che si trovano a 2 hop di distanza.

Per saperne di più GNNs, consulta A Comprehensive Survey on Graph Neural Networks. Per ulteriori informazioni sulla Deep Graph Library (DGL), visita la pagina web di DGL. Per un tutorial pratico sull'uso di DGL con GNNs, vedi Apprendimento delle reti neurali grafiche con Deep Graph Library.

Addestramento delle reti neurali a grafo

Nel machine learning il processo che consente a un modello di apprendere come fare previsioni valide per un'attività è denominato addestramento del modello. Questa operazione viene in genere eseguita specificando un obiettivo particolare da ottimizzare e un algoritmo da utilizzare per eseguire tale ottimizzazione.

Questo processo viene impiegato anche per addestrare una rete GNN ad apprendere rappresentazioni valide anche per l'attività a valle. Per tale attività viene creata una funzione obiettivo che viene ridotta al minimo durante l'addestramento del modello. Ad esempio, per la classificazione dei nodi, utilizziamo CrossEntropyLosscome obiettivo, il che penalizza le classificazioni errate, mentre per la regressione dei nodi riduciamo al minimo. MeanSquareError

L'obiettivo è in genere una funzione di perdita che accetta le previsioni del modello per un punto dati specifico e le confronta con il valore ground-truth per tale punto dati. Restituisce il valore di perdita, che mostra quanto siano lontane le previsioni del modello. L'obiettivo del processo di addestramento è ridurre al minimo le perdite e garantire che le previsioni dei modelli siano vicine al valore ground-truth.

L'algoritmo di ottimizzazione utilizzato nel deep learning per il processo di addestramento è in genere una variante della discesa del gradiente. In Neptune ML, utilizziamo Adam, un algoritmo per l'ottimizzazione basata su gradiente del primo ordine di funzioni obiettivo stocastiche basate su stime adattive di momenti di ordine inferiore.

Sebbene il processo di addestramento del modello tenti di garantire che i parametri del modello appresi siano vicini ai minimi della funzione obiettivo, le prestazioni complessive di un modello dipendono anche dagli iperparametri del modello, che sono impostazioni del modello che non vengono apprese dall'algoritmo di addestramento. Ad esempio, la dimensionalità della rappresentazione del nodo appresa, num-hidden, è un iperparametro che influisce sulle prestazioni del modello. Pertanto, nel machine learning è comune eseguire l'ottimizzazione degli iperparametri per scegliere gli iperparametri adatti.

Neptune ML utilizza SageMaker un processo di ottimizzazione degli iperparametri AI per avviare più istanze di addestramento dei modelli con diverse configurazioni di iperparametri per cercare di trovare il modello migliore per una serie di impostazioni di iperparametri. Per informazioni, consulta Personalizzazione delle configurazioni degli iperparametri dei modelli in Neptune ML.

Modelli di incorporamento del grafo della conoscenza in Neptune ML

I Knowledge graphs (KGs) sono grafici che codificano informazioni su diverse entità (nodi) e le relative relazioni (bordi). In Neptune ML i modelli di incorporamento del grafo della conoscenza vengono applicati per impostazione predefinita per eseguire la previsione dei collegamenti quando il grafo non contiene proprietà dei nodi, ma solo relazioni con altri nodi. Tuttavia, anche i modelli R-GCN con incorporamenti apprendibili possono essere utilizzati per questi grafi specificando il tipo di modello "rgcn", poiché i modelli di incorporamento dei grafi della conoscenza sono più semplici e progettati per essere efficaci per l'apprendimento di rappresentazioni per grafi della conoscenza su larga scala.

I modelli di incorporamento dei grafi della conoscenza vengono usati in un'attività di previsione dei collegamenti per prevedere i nodi o le relazioni che completano una tripla (h, r, t), dove h è il nodo di origine, r è il tipo di relazione e t è il nodo di destinazione.

I modelli di incorporamento del grafo della conoscenza implementati in Neptune ML sono distmult, transE e rotatE. Per ulteriori informazioni sui modelli di incorporamento del grafo della conoscenza, consulta DGL-KE.

Addestramento di modelli personalizzati in Neptune ML.

Neptune ML consente di definire e implementare modelli personalizzati, per scenari specifici. Per informazioni su come implementare un modello personalizzato e su come utilizzare l'infrastruttura di Neptune ML per addestrarlo, consulta Modelli personalizzati in Neptune ML..

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Addestramento del modello

Personalizzazione degli iperparametri

In questa pagina

Seleziona le tue preferenze relative ai cookie

Personalizza le tue preferenze relative ai cookie

Essenziali

Prestazione

Funzionali

Pubblicitari

Impossibile salvare le preferenze dei cookie

Modelli e addestramento dei modelli in Amazon Neptune ML

Reti neurali grafiche (GNNs) in Neptune ML

Addestramento delle reti neurali a grafo

Modelli di incorporamento del grafo della conoscenza in Neptune ML

Addestramento di modelli personalizzati in Neptune ML.

In questa pagina

Questa pagina ti è stata utile?

Argomento successivo:

Argomento precedente:

Hai bisogno di aiuto?