CatBoost - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CatBoost

CatBoostes una implementación de código abierto popular y de alto rendimiento del algoritmo Gradient Boosting Decision Tree ()GBDT. GBDTes un algoritmo de aprendizaje supervisado que intenta predecir con precisión una variable objetivo mediante la combinación de un conjunto de estimaciones de un conjunto de modelos más simples y más débiles.

CatBoost presenta dos avances algorítmicos fundamentales para: GBDT

  1. La implementación de la potenciación ordenada, una alternativa al algoritmo clásico basada en permutaciones

  2. Un algoritmo innovador para procesar características categóricas

Ambas técnicas se crearon para combatir un cambio de predicción provocado por un tipo especial de fuga de objetivo presente en todas las implementaciones actuales de algoritmos de potenciación por gradiente. Esta página incluye información sobre las recomendaciones de EC2 instancias de Amazon y cuadernos de muestra para CatBoost.

Recomendación de EC2 instancias de Amazon para el CatBoost algoritmo

SageMaker CatBoost actualmente solo los trenes utilizanCPUs. CatBoost es un algoritmo limitado a la memoria (a diferencia de un algoritmo limitado a la computación). Por lo tanto, una instancia de computación de uso general (por ejemplo, M5) es una opción mejor que una instancia optimizada para la computación (por ejemplo, C5). Además, recomendamos que disponga de suficiente memoria en total en las instancias seleccionadas para almacenar los datos de capacitación.

CatBoost cuadernos de muestra

La siguiente tabla describe una variedad de cuadernos de muestra que abordan diferentes casos de uso del SageMaker CatBoost algoritmo de Amazon.

Título del cuaderno Descripción

Clasificación tabular con Amazon SageMaker Light GBM y algoritmo CatBoost

Este cuaderno muestra el uso del SageMaker CatBoost algoritmo de Amazon para entrenar y alojar un modelo de clasificación tabular.

Regresión tabular con Amazon SageMaker Light GBM y algoritmo CatBoost

En este cuaderno se muestra el uso del SageMaker CatBoost algoritmo de Amazon para entrenar y alojar un modelo de regresión tabular.

Para obtener instrucciones sobre cómo crear instancias de Jupyter Notebook y acceder a ellas, que puede utilizar para ejecutar el ejemplo, consulte. SageMaker Instancias de Amazon SageMaker Notebook Una vez que haya creado una instancia de bloc de notas y la haya abierto, seleccione la pestaña SageMakerEjemplos para ver una lista de todos los ejemplos. SageMaker Para abrir un bloc de notas, elija su pestaña Usar y elija Crear copia.