CatBoost - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

CatBoost

CatBoostes una implementación de código abierto popular y de alto rendimiento del algoritmo Gradient Boosting Decision Tree (GBDT). GBDT es un algoritmo de aprendizaje supervisado que intenta predecir adecuadamente una variable objetivo mediante la combinación de un conjunto de estimaciones a partir de un conjunto de modelos más simples y más débiles.

CatBoost presenta dos avances algorítmicos fundamentales en el GBDT:

  1. La implementación de la potenciación ordenada, una alternativa al algoritmo clásico basada en permutaciones

  2. Un algoritmo innovador para procesar características categóricas

Ambas técnicas se crearon para combatir un cambio de predicción provocado por un tipo especial de fuga de objetivo presente en todas las implementaciones actuales de algoritmos de potenciación por gradiente. Esta página incluye información sobre las recomendaciones de EC2 instancias de Amazon y cuadernos de muestra para CatBoost.

Recomendación de EC2 instancias de Amazon para el CatBoost algoritmo

SageMaker CatBoost Actualmente, la IA solo entrena usando CPUs. CatBoost es un algoritmo limitado a la memoria (a diferencia de un algoritmo limitado a la computación). Por lo tanto, una instancia de computación de uso general (por ejemplo, M5) es una opción mejor que una instancia optimizada para la computación (por ejemplo, C5). Además, recomendamos que disponga de suficiente memoria en total en las instancias seleccionadas para almacenar los datos de capacitación.

CatBoost cuadernos de muestra

La siguiente tabla describe una variedad de cuadernos de muestra que abordan diferentes casos de uso del CatBoost algoritmo Amazon SageMaker AI.

Título del cuaderno Descripción

Clasificación tabular con Amazon SageMaker AI LightGBM y algoritmo CatBoost

Este cuaderno muestra el uso del CatBoost algoritmo Amazon SageMaker AI para entrenar y alojar un modelo de clasificación tabular.

Regresión tabular con Amazon SageMaker AI LightGBM y algoritmo CatBoost

Este cuaderno muestra el uso del CatBoost algoritmo Amazon SageMaker AI para entrenar y alojar un modelo de regresión tabular.

Para obtener instrucciones sobre cómo crear instancias de Jupyter Notebook y acceder a ellas, que puede utilizar para ejecutar el ejemplo en SageMaker IA, consulte. Instancias de Amazon SageMaker Notebook Tras crear una instancia de bloc de notas y abrirla, selecciona la pestaña Ejemplos de SageMaker IA para ver una lista de todos los ejemplos de SageMaker IA. Para abrir un bloc de notas, elija su pestaña Usar y elija Crear copia.