Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
GBMIperparametri della luce
La tabella seguente contiene il sottoinsieme di iperparametri richiesti o più comunemente utilizzati per l'algoritmo Amazon SageMaker LightGBM. Gli utenti impostano questi parametri per agevolare la stima dei parametri del modello dai dati. L'GBMalgoritmo SageMaker Light è un'implementazione del pacchetto Light open source. GBM
Nota
Gli iperparametri predefiniti si basano su set di dati di esempio in Notebook Light GBM Sample.
Per impostazione predefinita, l'GBMalgoritmo SageMaker Light sceglie automaticamente una metrica di valutazione e una funzione oggettiva in base al tipo di problema di classificazione. L'GBMalgoritmo Light rileva il tipo di problema di classificazione in base al numero di etichette nei dati. Per i problemi di regressione, il parametro di valutazione è l'errore quadratico medio e la funzione obiettivo è la perdita di L2. Per i problemi di classificazione binaria, il parametro di valutazione e la funzione obiettivo sono entrambe entropia binaria incrociata. Per i problemi di classificazione multiclasse, il parametro di valutazione è l'entropia incrociata multiclasse e la funzione obiettivo è softmax. È possibile utilizzare l'iperparametro metric
per modificare il parametro di valutazione predefinito. Fate riferimento alla tabella seguente per ulteriori informazioni sugli GBM iperparametri Light, incluse descrizioni, valori validi e valori predefiniti.
Nome parametro | Descrizione |
---|---|
num_boost_round |
Il numero massimo di iterazioni di potenziamento. Nota: internamente, Light GBM costruisce Valori validi: numero intero, intervallo: numero intero positivo. Valore predefinito: |
early_stopping_rounds |
L'addestramento si interromperà se un parametro di un dato di convalida non migliora nell'ultimo round Valori validi: numero intero. Valore predefinito: |
metric |
Parametro di valutazione per i dati di convalida. Se
Valori validi: stringa, uno dei seguenti valori: ( Valore predefinito: |
learning_rate |
La velocità con cui i pesi del modello vengono aggiornati dopo aver esaminato ogni batch di esempi di addestramento. Valori validi: float, intervallo: ( Valore predefinito: |
num_leaves |
Il numero massimo di foglie in un albero. Valori validi: intero, intervallo: ( Valore predefinito: |
feature_fraction |
Un sottoinsieme di funzionalità da selezionare su ogni iterazione (albero). Deve essere inferiore a 1,0. Valori validi: float, intervallo: ( Valore predefinito: |
bagging_fraction |
Un sottoinsieme di funzionalità simili a Valori validi: float, intervallo: ( Valore predefinito: |
bagging_freq |
La frequenza di esecuzione del bagging. Ad ogni Valori validi: numeri interi, intervallo: numeri interi non negativi. Valore predefinito: |
max_depth |
La profondità massima per un modello ad albero. Viene utilizzata per gestire l'overfit quando la quantità di dati è ridotta. Se Valori validi: numero intero. Valore predefinito: |
min_data_in_leaf |
La quantità minima di dati in una foglia. Può essere utilizzata per gestire l’overfitting. Valori validi: numeri interi, intervallo: numeri interi non negativi. Valore predefinito: |
max_delta_step |
Utilizzato per limitare la produzione massima delle foglie degli alberi. Se Valori validi: float. Valore predefinito: |
lambda_l1 |
Regolarizzazione L1. Valori validi: float, intervallo: float non negativi. Valore predefinito: |
lambda_l2 |
Regolarizzazione L2. Valori validi: float, intervallo: float non negativi. Valore predefinito: |
boosting |
Tipo di boosting Valori validi: stringa, uno dei seguenti valori: ( Valore predefinito: |
min_gain_to_split |
Il guadagno minimo per eseguire una suddivisione. Può essere usato per velocizzare l'addestramento. Valori validi: numeri interi, float: float non negativi. Valore predefinito: |
scale_pos_weight |
Il peso delle etichette con classe positiva. Utilizzato solo per attività di classificazione binaria. Valori validi: float, intervallo: float positivi. Valore predefinito: |
tree_learner |
Tipo di learner ad albero. Valori validi: stringa, uno dei seguenti valori: ( Valore predefinito: |
feature_fraction_bynode |
Seleziona un sottoinsieme di funzionalità casuali su ogni nodo dell'albero. Ad esempio, se Valori validi: intero, intervallo: ( Valore predefinito: |
is_unbalance |
Impostato su Valori validi: stringa: ( Valore predefinito: |
max_bin |
Il numero massimo di container utilizzati per inserire i valori delle funzionalità di bucket. Un numero limitato di container può ridurre la precisione dell'addestramento, ma può aumentare le prestazioni generali. Può essere utilizzata per gestire l’overfitting. Valori validi: intero, intervallo: (1, ∞). Valore predefinito: |
tweedie_variance_power |
Controlla la varianza della distribuzione Tweedie. Impostalo più vicino Valori validi: float, intervallo: [ Valore predefinito: |
num_threads |
Numero di thread paralleli utilizzati per eseguire LightGBM. Il valore 0 indica il numero predefinito di thread in OpenMP. Valori validi: numeri interi, intervallo: numeri interi non negativi. Valore predefinito: |
verbosity |
La verbosità dei messaggi di stampa. Se Valori validi: numero intero. Valore predefinito: |