Flussi di lavoro trasduttivi incrementali - Amazon Neptune

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Flussi di lavoro trasduttivi incrementali

Mentre per aggiornare gli artefatti del modello è sufficiente eseguire nuovamente i passaggi da uno a tre (dall'esportazione e configurazione dei dati alla trasformazione del modello), Neptune ML supporta modi più semplici per aggiornare le previsioni di ML in batch utilizzando nuovi dati. Uno prevede l'utilizzo di un flusso di lavoro basato su modello incrementale e un altro prevede l'utilizzo del riaddestramento del modello con un avvio a caldo.

Flusso di lavoro basato su modello incrementale

In questo flusso di lavoro, si aggiornano le previsioni di ML senza riaddestrare il modello ML.

Nota

È possibile farlo solo quando i dati del grafo sono stati aggiornati con nuovi nodi e/o archi. Non funzionerà quando i nodi vengono rimossi.

  1. Esportazione e configurazione dei dati: questo passaggio è uguale a quello del flusso di lavoro principale.

  2. Pre-elaborazione incrementale dei dati: questo passaggio è simile al passaggio di pre-elaborazione dei dati nel flusso di lavoro principale, ma utilizza la stessa configurazione di elaborazione utilizzata in precedenza, che corrisponde a un modello addestrato specifico.

  3. Trasformazione del modello: anziché un passaggio di addestramento del modello, questo passaggio di trasformazione del modello recupera il modello addestrato dal flusso di lavoro principale e dai risultati del passaggio di pre-elaborazione incrementale dei dati e genera nuovi artefatti del modello da utilizzare per l'inferenza. La fase di trasformazione del modello avvia un SageMaker processo di elaborazione per eseguire il calcolo che genera gli artefatti del modello aggiornati.

  4. Aggiornamento dell'endpoint di SageMaker inferenza Amazon: facoltativamente, se disponi di un endpoint di inferenza esistente, questo passaggio aggiorna l'endpoint con i nuovi artefatti del modello generati dalla fase di trasformazione del modello. In alternativa, puoi anche creare un nuovo endpoint di inferenza con i nuovi artefatti del modello.

Riaddestramento del modello con avvio a caldo

Utilizzando questo flusso di lavoro, puoi addestrare e implementare un nuovo modello di machine learning per generare previsioni utilizzando i dati del grafo incrementale, ma partire da un modello esistente generato tramite il flusso di lavoro principale:

  1. Esportazione e configurazione dei dati: questo passaggio è uguale a quello del flusso di lavoro principale.

  2. Pre-elaborazione incrementale dei dati: questo passaggio è uguale a quello del flusso di lavoro di inferenza del modello incrementale. I nuovi dati del grafo devono essere elaborati con lo stesso metodo di elaborazione usato in precedenza per l'addestramento del modello.

  3. Addestramento dei modelli con avvio a caldo: l'addestramento dei modelli è simile a quello che avviene nel flusso di lavoro principale, ma è possibile accelerare la ricerca degli iperparametri del modello sfruttando le informazioni dell'attività di addestramento del modello precedente.

  4. Aggiornamento dell'endpoint di SageMaker inferenza Amazon: questo passaggio è lo stesso del flusso di lavoro di inferenza del modello incrementale.