Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Linee guida per la personalizzazione dei modelli
I parametri ideali per la personalizzazione di un modello dipendono dal set di dati e dall'attività a cui è destinato il modello. Ti consigliamo di sperimentare i valori per determinare quali parametri funzionano meglio per il tuo caso specifico. A tal fine, puoi valutare il modello eseguendo un processo di valutazione del modello. Per ulteriori informazioni, consulta Scegli il modello con le prestazioni migliori utilizzando le valutazioni di Amazon Bedrock.
Questo argomento fornisce linee guida e valori consigliati come base per la personalizzazione di Amazon Titan Modello Text Premier. Per altri modelli, consulta la documentazione del provider.
Utilizza le metriche di addestramento e convalida dei file di output generati quando invii un processo di ottimizzazione per adattare meglio i parametri. Trova questi file nel bucket Amazon S3 in cui hai scritto l'output o usa l'operazione. GetCustomModel
Amazon Titan Testo Premier
Le seguenti linee guida si riferiscono a Titan text-to-textModello Text Premier. Per informazioni sugli iperparametri che è possibile impostare, consulta Iperparametri di personalizzazione del modello di Titan testo Amazon.
Impatto su altri tipi di attività
In generale, più grande è il set di dati di addestramento, migliori sono le prestazioni per un'attività specifica. Tuttavia, la formazione per un'attività specifica potrebbe peggiorare le performance del modello in diverse attività, specialmente se si utilizzano molti esempi. Ad esempio, se il set di dati di addestramento per un'attività di riepilogo contiene 100.000 campioni, il modello potrebbe avere performance peggiori in un'attività di classificazione).
Dimensione del modello
In generale, più grande è il set di dati di addestramento, migliori sono le prestazioni per un'attività con dati di addestramento limitati.
Se utilizzi il modello per un'attività di classificazione, potresti ottenere vantaggi abbastanza ridotti per l'ottimizzazione few-shot (meno di 100 campioni), in particolare se il numero di classi è relativamente basso (meno di 100).
Epoche
Ti consigliamo di utilizzare le seguenti metriche per determinare il numero di epoche da impostare:
-
Precisione dell'output di convalida: imposta il numero di epoche su un valore che restituisca una precisione elevata.
-
Perdita di addestramento e convalida: determina il numero di epoche dopo le quali la perdita di addestramento e convalida diventa stabile. Ciò corrisponde al momento in cui il modello converge. Puoi trovare i valori di perdita di addestramento nei file
step_wise_training_metrics.csv
evalidation_metrics.csv
.
Dimensione batch
Quando cambi la dimensione del batch, ti consigliamo di modificare il tasso di apprendimento utilizzando la formula seguente:
newLearningRate = oldLearningRate x newBatchSize / oldBatchSize
Il modello Titan Text Premier attualmente supporta solo minibatch da 1 per la messa a punto da parte del cliente.
Velocità di apprendimento
Per ottenere i migliori risultati dalle funzionalità di ottimizzazione, consigliamo di utilizzare un tasso di apprendimento compreso tra 1,00E-07 e 1,00E-05. Un buon punto di partenza è il valore predefinito consigliato di 1,00E-06. Un tasso di apprendimento più elevato può aiutare la formazione a convergere più rapidamente, tuttavia può influire negativamente sulle funzionalità del modello di base.
Convalida i dati di allenamento con un piccolo sottocampione: per convalidare la qualità dei dati di allenamento, consigliamo di sperimentare un set di dati più piccolo (circa 100 secondi di campioni) e di monitorare le metriche di convalida, prima di inviare il lavoro di formazione con un set di dati di formazione più grande.
Fasi di riscaldamento del tasso di apprendimento
Consigliamo il valore predefinito di 5.