Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
TabTransformer iperparametri
La tabella seguente contiene il sottoinsieme di iperparametri richiesti o più comunemente utilizzati per l'algoritmo Amazon SageMaker TabTransformer . Gli utenti impostano questi parametri per agevolare la stima dei parametri del modello dai dati. L' SageMaker TabTransformeralgoritmo è un'implementazione del pacchetto open source TabTransformer
Nota
Gli iperparametri predefiniti si basano su set di dati di esempio in TabTransformer quaderni di esempio.
L' SageMaker TabTransformer algoritmo sceglie automaticamente una metrica di valutazione e una funzione oggettiva in base al tipo di problema di classificazione. L' TabTransformer algoritmo rileva il tipo di problema di classificazione in base al numero di etichette nei dati. Per i problemi di regressione, il parametro di valutazione è l'errore quadratico r e la funzione obiettivo è l’errore quadratico medio. Per i problemi di classificazione binaria, il parametro di valutazione e la funzione obiettivo sono entrambe entropia binaria incrociata. Per i problemi di classificazione multiclasse, il parametro di valutazione e la funzione obiettivo sono entrambi un'entropia incrociata multiclasse.
Nota
Le funzioni metriche di TabTransformer valutazione e oggettive non sono attualmente disponibili come iperparametri. L'algoritmo SageMaker TabTransformer integrato rileva invece automaticamente il tipo di attività di classificazione (regressione, binaria o multiclasse) in base al numero di numeri interi univoci nella colonna dell'etichetta e assegna una metrica di valutazione e una funzione oggettiva.
Nome parametro | Descrizione |
---|---|
n_epochs |
Numero di epoche per addestrare la rete neurale profonda. Valori validi: numero intero, intervallo: numero intero positivo. Valore predefinito: |
patience |
L'addestramento si interromperà se un parametro di un dato di convalida non migliora nell'ultimo round Valori validi: intero, intervallo: ( Valore predefinito: |
learning_rate |
La velocità con cui i pesi del modello vengono aggiornati dopo aver esaminato ogni batch di esempi di addestramento. Valori validi: float, intervallo: numero a virgola mobile positivo. Valore predefinito: |
batch_size |
Il numero di esempi propagati attraverso la rete. Valori validi: intero, intervallo: ( Valore predefinito: |
input_dim |
La dimensione degli incorporamenti per codificare le colonne categoriche e/o continue. Valori validi: stringa, uno dei seguenti valori: Valore predefinito: |
n_blocks |
Il numero di blocchi encoder del trasformatore. Valori validi: intero, intervallo: ( Valore predefinito: |
attn_dropout |
Tasso di dropout applicato ai livelli di attenzione Multi-Head. Valori validi: float, intervallo: ( Valore predefinito: |
mlp_dropout |
Tasso di abbandono applicato alla FeedForward rete all'interno dei livelli dell'encoder e degli strati finali sopra gli encoder Transformer. MLP Valori validi: float, intervallo: ( Valore predefinito: |
frac_shared_embed |
La frazione di incorporamenti condivisa da tutte le diverse categorie per una colonna particolare. Valori validi: float, intervallo: ( Valore predefinito: |