Perfeziona un modello in Studio - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Perfeziona un modello in Studio

La messa a punto consente di addestrare un modello già addestrato su un nuovo set di dati senza addestramento da zero. Questo processo, noto anche come trasferimento dell'apprendimento, può produrre modelli accurati con set di dati più piccoli e tempi di addestramento ridotti. Per ottimizzare i modelli di JumpStart base, accedi a una scheda con i dettagli del modello nell'interfaccia utente di Studio. Per ulteriori informazioni su come aprire JumpStart in Studio, consulta. Apri e usa in Studio JumpStart Dopo essere passati alla scheda con i dettagli del modello che preferisci, scegli Train nell'angolo in alto a destra. Tieni presente che non tutti i modelli sono dotati di regolazioni di precisione.

Importante

Alcuni modelli base richiedono l'accettazione esplicita di un contratto di licenza con l'utente finale (EULA) prima della messa a punto. Per ulteriori informazioni, consulta Accettazione dell'EULA in Amazon Studio SageMaker .

Impostazioni del modello

Quando si utilizza un modello JumpStart base pre-addestrato in Amazon SageMaker Studio, la posizione dell'artefatto del modello (URI Amazon S3) viene popolata per impostazione predefinita. Per modificare l'URI predefinito di Amazon S3, scegli Inserisci la posizione dell'artefatto del modello. Non tutti i modelli supportano la modifica della posizione degli artefatti del modello.

Impostazioni dei dati

Nel campo Data, fornisci un punto URI Amazon S3 alla posizione del set di dati di addestramento. L'URI predefinito di Amazon S3 rimanda a un set di dati di addestramento di esempio. Per modificare l'URI predefinito di Amazon S3, scegli Inserisci set di dati di addestramento e modifica l'URI. Assicurati di consultare la scheda dettagliata del modello in Amazon SageMaker Studio per informazioni sulla formattazione dei dati di addestramento.

Iperparametri

È possibile personalizzare gli iperparametri del processo di addestramento utilizzati per ottimizzare il modello. Gli iperparametri disponibili per ogni modello ottimizzabile variano a seconda del modello.

I seguenti iperparametri sono comuni tra i modelli:

  • Epoche: un'epoca è un ciclo dell'intero set di dati. Intervalli multipli completano un batch e alla fine più batch completano un'epoca. Vengono eseguite più epoche finché la precisione del modello non raggiunge un livello accettabile o quando il tasso di errore scende al di sotto di un livello accettabile.

  • Tasso di apprendimento: la quantità di valori da modificare tra le epoche. Man mano che il modello viene perfezionato, i pesi interni vengono modificati e i tassi di errore vengono controllati per vedere se il modello migliora. Un tasso di apprendimento tipico è di 0,1 o 0,01, dove 0,01 rappresenta un aggiustamento molto inferiore e potrebbe far sì che l'addestramento richieda molto tempo per convergere, mentre 0,1 è molto più elevato e può causare un superamento dell’addestramento. È uno degli iperparametri principali che si possono modificare per addestrare il modello. Notare che, per i modelli testuali, un tasso di apprendimento molto più basso (5e-5 per BERT) può portare a un modello più accurato.

  • Dimensione del batch: il numero di record del set di dati da selezionare per ogni intervallo da inviare al gruppo GPUs per l'addestramento.

Consultate le istruzioni dei comandi e le informazioni aggiuntive nella scheda con i dettagli del modello nell'interfaccia utente di Studio per saperne di più sugli iperparametri specifici del modello di vostra scelta.

Per ulteriori informazioni sugli iperparametri disponibili, consulta. Iperparametri di regolazione fine comunemente supportati

Implementazione

Specificate il tipo di istanza di addestramento e la posizione dell'artefatto di output per il vostro lavoro di formazione. Puoi scegliere solo tra istanze compatibili con il modello che preferisci nell'ambito della messa a punto dell'interfaccia utente di Studio. La posizione predefinita degli artefatti di output è il bucket AI predefinito. SageMaker Per modificare la posizione dell'artefatto di output, scegli Inserisci la posizione dell'artefatto di output e modifica l'URI di Amazon S3.

Sicurezza

Specificate le impostazioni di sicurezza da utilizzare per il vostro lavoro di formazione, incluso il ruolo IAM utilizzato dall' SageMaker IA per addestrare il vostro modello, se il processo di formazione deve connettersi a un cloud privato virtuale (VPC) ed eventuali chiavi di crittografia per proteggere i dati.

Informazioni aggiuntive

Nel campo Informazioni aggiuntive puoi modificare il nome del processo di formazione. Puoi anche aggiungere e rimuovere tag sotto forma di coppie chiave-valore per organizzare e classificare i tuoi lavori di formazione finalizzati alla messa a punto.

Dopo aver fornito le informazioni per la configurazione di messa a punto, scegliete Invia. Se il modello base pre-addestrato che hai scelto di perfezionare richiede l'accordo esplicito di un contratto di licenza con l'utente finale (EULA) prima della formazione, l'EULA viene fornito in una finestra pop-up. Per accettare i termini dell'EULA, scegli Accetta. Sei responsabile della revisione e del rispetto di tutte le condizioni di licenza applicabili e di verificare che siano accettabili per il tuo caso d'uso, prima di scaricare o utilizzare un modello.