Linee guida per la personalizzazione dei modelli

I parametri ideali per la personalizzazione di un modello dipendono dal set di dati e dall'attività a cui è destinato il modello. Ti consigliamo di sperimentare i valori per determinare quali parametri funzionano meglio per il tuo caso specifico. A tal fine, puoi valutare il modello eseguendo un processo di valutazione del modello. Per ulteriori informazioni, consulta Scegli il modello con le prestazioni migliori utilizzando le valutazioni di Amazon Bedrock.

Questo argomento fornisce linee guida e valori consigliati come base per la personalizzazione di Amazon Titan Modello Text Premier. Per altri modelli, consulta la documentazione del provider.

Utilizza le metriche di addestramento e convalida dei file di output generati quando invii un processo di ottimizzazione per adattare meglio i parametri. Trova questi file nel bucket Amazon S3 in cui hai scritto l'output o usa l'operazione. GetCustomModel

Amazon Titan Testo Premier

Le seguenti linee guida si riferiscono a Titan text-to-textModello Text Premier. Per informazioni sugli iperparametri che è possibile impostare, consulta Iperparametri di personalizzazione del modello di Titan testo Amazon.

Impatto su altri tipi di attività

In generale, più grande è il set di dati di addestramento, migliori sono le prestazioni per un'attività specifica. Tuttavia, la formazione per un'attività specifica potrebbe peggiorare le performance del modello in diverse attività, specialmente se si utilizzano molti esempi. Ad esempio, se il set di dati di addestramento per un'attività di riepilogo contiene 100.000 campioni, il modello potrebbe avere performance peggiori in un'attività di classificazione).

Dimensione del modello

In generale, più grande è il set di dati di addestramento, migliori sono le prestazioni per un'attività con dati di addestramento limitati.

Se utilizzi il modello per un'attività di classificazione, potresti ottenere vantaggi abbastanza ridotti per l'ottimizzazione few-shot (meno di 100 campioni), in particolare se il numero di classi è relativamente basso (meno di 100).

Epoche

Ti consigliamo di utilizzare le seguenti metriche per determinare il numero di epoche da impostare:

Precisione dell'output di convalida: imposta il numero di epoche su un valore che restituisca una precisione elevata.
Perdita di addestramento e convalida: determina il numero di epoche dopo le quali la perdita di addestramento e convalida diventa stabile. Ciò corrisponde al momento in cui il modello converge. Puoi trovare i valori di perdita di addestramento nei file step_wise_training_metrics.csv e validation_metrics.csv.

Dimensione batch

Quando cambi la dimensione del batch, ti consigliamo di modificare il tasso di apprendimento utilizzando la formula seguente:


newLearningRate = oldLearningRate x newBatchSize / oldBatchSize

Il modello Titan Text Premier attualmente supporta solo minibatch da 1 per la messa a punto da parte del cliente.

Velocità di apprendimento

Per ottenere i migliori risultati dalle funzionalità di ottimizzazione, consigliamo di utilizzare un tasso di apprendimento compreso tra 1,00E-07 e 1,00E-05. Un buon punto di partenza è il valore predefinito consigliato di 1,00E-06. Un tasso di apprendimento più elevato può aiutare la formazione a convergere più rapidamente, tuttavia può influire negativamente sulle funzionalità del modello di base.

Convalida i dati di allenamento con un piccolo sottocampione: per convalidare la qualità dei dati di allenamento, consigliamo di sperimentare un set di dati più piccolo (circa 100 secondi di campioni) e di monitorare le metriche di convalida, prima di inviare il lavoro di formazione con un set di dati di formazione più grande.

Fasi di riscaldamento del tasso di apprendimento

Consigliamo il valore predefinito di 5.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Regioni e modelli supportati

Prerequisiti per la personalizzazione del modello