Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
CatBoost iperparametri
La tabella seguente contiene il sottoinsieme di iperparametri richiesti o più comunemente utilizzati per l'algoritmo Amazon SageMaker CatBoost . Gli utenti impostano questi parametri per agevolare la stima dei parametri del modello dai dati. L' SageMaker CatBoost algoritmo è un'implementazione del pacchetto open source CatBoost
Nota
Gli iperparametri predefiniti si basano su set di dati di esempio in CatBoost quaderni di esempio.
Per impostazione predefinita, l' SageMaker CatBoost algoritmo sceglie automaticamente una metrica di valutazione e una funzione di perdita in base al tipo di problema di classificazione. L' CatBoost algoritmo rileva il tipo di problema di classificazione in base al numero di etichette nei dati. Per i problemi di regressione, il parametro di valutazione e le funzioni di perdita sono entrambi un errore quadratico medio. Per i problemi di classificazione binaria, la metrica di valutazione è Area Under the Curve (AUC) e la funzione di perdita è log loss. Per i problemi di classificazione multiclasse, il parametro di valutazione e le funzioni di perdita sono un'entropia incrociata multiclasse. È possibile utilizzare l'iperparametro eval_metric
per modificare il parametro di valutazione predefinito. Fate riferimento alla tabella seguente per ulteriori informazioni sugli GBM iperparametri Light, incluse descrizioni, valori validi e valori predefiniti.
Nome parametro | Descrizione |
---|---|
iterations |
Il numero massimo di alberi che possono essere costruiti. Valori validi: numero intero, intervallo: numero intero positivo. Valore predefinito: |
early_stopping_rounds |
L'addestramento si interromperà se un parametro di un dato di convalida non migliora nell'ultimo round Valori validi: numero intero. Valore predefinito: |
eval_metric |
Parametro di valutazione per i dati di convalida. Se
Valori validi: stringa, fate riferimento alla CatBoost documentazione Valore predefinito: |
learning_rate |
La velocità con cui i pesi del modello vengono aggiornati dopo aver esaminato ogni batch di esempi di addestramento. Valori validi: float, intervallo: ( Valore predefinito: |
depth |
Profondità dell'albero. Valori validi: intero, intervallo: ( Valore predefinito: |
l2_leaf_reg |
Coefficiente per il termine di regolarizzazione L2 della funzione di costo. Valori validi: numero intero, intervallo: numero intero positivo. Valore predefinito: |
random_strength |
La quantità di randomizzazione da utilizzare per le suddivisioni del punteggio quando viene selezionata la struttura ad albero. Utilizza questo parametro per l’overfitting del modello. Valori validi: float, intervallo: numero a virgola mobile positivo. Valore predefinito: |
max_leaves |
Il numero massimo di foglie nell’albero risultante. Può essere utilizzato solo con la policy di crescita Valori validi: intero, intervallo: [ Valore predefinito: |
rsm |
Metodo subspaziale casuale. La percentuale di funzionalità da utilizzare in ogni selezione suddivisa, quando le funzionalità vengono nuovamente selezionate casualmente. Valori validi: float, intervallo: ( Valore predefinito: |
sampling_frequency |
Frequenza di campionamento di pesi e oggetti durante la costruzione di alberi. Valori validi: stringa: ( Valore predefinito: |
min_data_in_leaf |
Il numero minimo di campioni di addestramento in una foglia. CatBoost non cerca nuove divisioni nelle foglie con un numero di campioni inferiore al valore specificato. Può essere utilizzato solo con le policy di crescita Valori validi: intero, intervallo: ( Valore predefinito: |
bagging_temperature |
Definisce le impostazioni del bootstrap bayesiano. Utilizza il bootstrap bayesiano per assegnare pesi casuali agli oggetti. Se Valori validi: float, intervallo: float non negativi. Valore predefinito: |
boosting_type |
Lo schema di boosting. “Auto” significa che Valori validi: stringa, uno dei seguenti valori: ( Valore predefinito: |
scale_pos_weight |
Il peso della classe positiva nella classificazione binaria. Il valore viene utilizzato come moltiplicatore per i pesi degli oggetti della classe positiva. Valori validi: float, intervallo: float positivi. Valore predefinito: |
max_bin |
Il numero di suddivisioni per le funzionalità numeriche. Valori validi: stringa: ( Valore predefinito: |
grow_policy |
La policy di crescita degli alberi. Definisce come eseguire costruzioni di alberi greedy. Valori validi: stringa, uno dei seguenti valori: ( Valore predefinito: |
random_seed |
Il seed casuale usato per l’addestramento. Valori validi: numeri interi, intervallo: numeri interi non negativi. Valore predefinito: |
thread_count |
Il numero di thread da utilizzare durante l'addestramento. Se Valori validi: un numero intero: ( Valore predefinito: |
verbose |
La verbosità dei messaggi di stampa, con livelli più alti corrispondenti a dichiarazioni di stampa più dettagliate. Valori validi: numero intero, intervallo: numero intero positivo. Valore predefinito: |