CatBoost - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

CatBoost

CatBoostè un'implementazione open source popolare e ad alte prestazioni dell'algoritmo Gradient Boosting Decision Tree (). GBDT GBDTè un algoritmo di apprendimento supervisionato che tenta di prevedere con precisione una variabile target combinando un insieme di stime tratte da una serie di modelli più semplici e più deboli.

CatBoost introduce due progressi algoritmici fondamentali per: GBDT

  1. L'implementazione del boosting ordinato, un'alternativa basata sulla permutazione all'algoritmo classico

  2. Un algoritmo innovativo per l'elaborazione di funzionalità categoriali

Entrambe le tecniche sono state create per contrastare un cambiamento di previsione causato da uno speciale tipo di perdita di dati di destinazione presente in tutte le implementazioni attualmente esistenti degli algoritmi di gradient boosting. Questa pagina include informazioni sui consigli sulle EC2 istanze Amazon e sui notebook di esempio per. CatBoost

Raccomandazione dell'EC2istanza Amazon per l' CatBoostalgoritmo

SageMaker CatBoost attualmente utilizzano solo treniCPUs. CatBoost è un algoritmo legato alla memoria (anziché legato al calcolo). Pertanto, un'istanza di calcolo a scopo generico (ad esempio, M5) rappresenta una scelta migliore rispetto a un'istanza ottimizzata per il calcolo (ad esempio, C5). Inoltre, consigliamo di disporre di memoria sufficiente nelle istanze selezionate per conservare i dati di addestramento.

CatBoost quaderni di esempio

La tabella seguente illustra una serie di notebook di esempio che affrontano diversi casi d'uso dell'algoritmo Amazon. SageMaker CatBoost

Titolo del notebook Descrizione

Classificazione tabulare con Amazon SageMaker Light GBM e algoritmo CatBoost

Questo notebook dimostra l'uso dell' SageMaker CatBoostalgoritmo Amazon per addestrare e ospitare un modello di classificazione tabulare.

Regressione tabulare con Amazon SageMaker Light e algoritmo GBM CatBoost

Questo notebook dimostra l'uso dell' SageMaker CatBoostalgoritmo Amazon per addestrare e ospitare un modello di regressione tabulare.

Per istruzioni su come creare e accedere alle istanze di notebook Jupyter utilizzabili per eseguire l'esempio, consulta. SageMaker Istanze Amazon SageMaker Notebook Dopo aver creato un'istanza di notebook e averla aperta, scegli la scheda SageMakerEsempi per visualizzare un elenco di tutti gli esempi. SageMaker Per aprire un notebook, seleziona la relativa scheda Utilizza e scegli Crea copia.