Panoramica del volano - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Panoramica del volano

Un flywheel è una risorsa Amazon Comprehend che orchestra la formazione e la valutazione di nuove versioni di un modello personalizzato. Puoi creare un volano per utilizzare un modello addestrato esistente oppure Amazon Comprehend può creare e addestrare un nuovo modello per il volano. Usa volani con modelli personalizzati in testo semplice per la classificazione personalizzata o il riconoscimento personalizzato delle entità.

Puoi configurare e gestire i volani utilizzando la console o l'API Amazon Comprehend. Puoi anche configurare i volani utilizzando. AWS CloudFormation

Quando crei un flywheel, Amazon Comprehend crea un data lake nel tuo account. Il data lake archivia e gestisce tutti i dati del volano, come i dati di addestramento e i dati di test per tutte le versioni del modello.

Imposta la versione del modello attivo in modo che sia la versione del modello flywheel che desideri utilizzare per i lavori di inferenza o gli endpoint Amazon Comprehend. Inizialmente, il volano contiene una versione del modello. Nel corso del tempo, man mano che si addestrano nuove versioni del modello, si seleziona la versione con le migliori prestazioni come versione attiva del modello. Quando un utente specifica l'ARN del flywheel per eseguire un processo di inferenza, Amazon Comprehend esegue il lavoro utilizzando la versione del modello attivo del flywheel.

Periodicamente, si ottengono nuovi dati etichettati (dati di addestramento o dati di test) per il modello. I nuovi dati vengono resi disponibili al volano creando uno o più set di dati. Un set di dati contiene dati di input per addestrare o testare il modello personalizzato associato a un volano. Amazon Comprehend carica i dati di input nel data lake del volano.

Per incorporare i nuovi set di dati nel tuo modello personalizzato, devi creare ed eseguire un'iterazione del volano. Un'iterazione con volano è un flusso di lavoro che utilizza i nuovi set di dati per valutare la versione attiva del modello e addestrare una nuova versione del modello. In base alle metriche relative alle versioni esistenti e nuove del modello, è possibile decidere se promuovere la nuova versione del modello come versione attiva.

È possibile utilizzare la versione del modello Flywheel Active per eseguire analisi personalizzate (lavori in tempo reale o asincroni). Per utilizzare il modello del volano per l'analisi in tempo reale, è necessario creare un endpoint per il volano.

Non sono previsti costi aggiuntivi per l'utilizzo dei volani. Tuttavia, quando si esegue un'iterazione del volano, si devono sostenere i costi standard per l'addestramento di una nuova versione del modello e l'archiviazione dei dati del modello. Per informazioni dettagliate sui prezzi, consulta la pagina dei prezzi di Amazon Comprehend.

Set di dati Flywheel

Per aggiungere nuovi dati etichettati a un volano, si crea un set di dati. Ogni set di dati viene configurato come dati di addestramento o dati di test. Il set di dati viene associato a un volano specifico e a un modello personalizzato.

Dopo aver creato un set di dati, Amazon Comprehend carica i dati nel data lake del flywheel. Per ulteriori informazioni, consulta Data lake Flywheel.

Creazione del volano

Quando create un volano, potete associare il volano a un modello addestrato esistente oppure il volano può creare un nuovo modello.

Quando create un volano con un modello esistente, specificate la versione attiva del modello. Amazon Comprehend copia i dati di addestramento e di test del modello nel data lake del volano. Assicurati che i dati di training e test del modello si trovino nella stessa posizione Amazon S3 in cui hai creato il modello.

Per creare un volano per un nuovo modello, fornisci un set di dati per i dati di addestramento (e un set di dati opzionale per i dati di test) quando crei il volano. Quando si esegue il volano per creare la prima iterazione del volano, il volano addestra il nuovo modello.

Quando si addestra un modello personalizzato, si specifica un elenco di etichette personalizzate (classificazione personalizzata) o entità personalizzate (riconoscimento personalizzato delle entità) che il modello deve riconoscere. Tieni presente i seguenti punti importanti sulle etichette/entità personalizzate:

  • Quando create un volano per un nuovo modello, l'elenco di etichette/entità fornito durante la creazione del volano è l'elenco finale per il volano.

  • Quando create un volano da un modello esistente, l'elenco di etichette/entità associate a quel modello diventa l'elenco finale per il volano.

  • Se associ un nuovo set di dati al flywheel e tale set di dati contiene etichette/entità aggiuntive, Amazon Comprehend ignora le nuove etichette/entità.

  • Puoi esaminare l'elenco di etichette/entità di Flywheel utilizzando l'operazione API. DescribeFlywheel

    Nota

    Per la classificazione personalizzata, Amazon Comprehend compila l'elenco delle etichette dopo che lo stato del volano diventa ATTIVO. Attendi che il volano sia attivo prima di chiamare l'operazione API. DescribeFlywheel

Stati del volano

Un volano passa tra i seguenti stati:

  • CREAZIONE - Amazon Comprehend sta creando le risorse Flywheel. È possibile eseguire operazioni di lettura sul volano, ad esempio. DescribeFlywheel

  • ATTIVO - Il volano è attivo. È possibile determinare se è in corso un'iterazione del volano e visualizzarne lo stato. È possibile eseguire azioni di lettura sul volano e azioni come e. DeleteFlywheel UpdateFlywheel

  • AGGIORNAMENTO - Amazon Comprehend sta aggiornando il volano. È possibile eseguire operazioni di lettura sul volano.

  • ELIMINAZIONE: Amazon Comprehend sta eliminando il volano. È possibile eseguire operazioni di lettura sul volano.

  • FALLITA: l'operazione di creazione del volano non è riuscita.

Dopo che Amazon Comprehend elimina un flywheel, conservi l'accesso a tutti i dati del modello nel data lake Flywheel. Amazon Comprehend elimina tutti i metadati interni necessari per la gestione delle risorse Flywheel. Amazon Comprehend elimina anche i set di dati associati a questo volano (i dati del modello vengono salvati nel data lake).

Iterazioni Flywheel

Quando si ottengono nuovi dati di addestramento o test per un modello di volano, si creano uno o più nuovi set di dati per caricare i nuovi dati nel data lake del volano.

Quindi esegui il volano per creare una nuova iterazione del volano. L'iterazione del volano valuta la versione corrente del modello attivo utilizzando i nuovi dati e memorizza i risultati nel data lake. Il volano crea e addestra anche una nuova versione del modello.

Se il nuovo modello presenta prestazioni migliori rispetto alla versione corrente del modello attivo, è possibile promuovere la nuova versione del modello come versione attiva del modello. È possibile utilizzare la console o il funzionamento dell'UpdateFlywheelAPI per aggiornare la versione attiva del modello.