CatBoost - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CatBoost

CatBoostest une implémentation open source populaire et performante de l'algorithme Gradient Boosting Decision Tree (GBDT). GBDTest un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations issues d'un ensemble de modèles plus simples et plus faibles.

CatBoost introduit deux avancées algorithmiques essentielles pour GBDT :

  1. L'implémentation d'un renforcement ordonné, une alternative à l'algorithme classique axée sur la permutation

  2. Un algorithme innovant pour le traitement des caractéristiques catégorielles

Les deux techniques ont été créées pour lutter contre un changement de prédiction causé par un type particulier de fuite de cible présent dans toutes les implémentations existantes des algorithmes avec renforcement de gradient. Cette page contient des informations sur les recommandations relatives aux EC2 instances Amazon et des exemples de blocs-notes pour CatBoost.

Recommandation d'EC2instance Amazon pour l' CatBoostalgorithme

SageMaker CatBoost Actuellement, seuls les trains utilisent l'IACPUs. CatBoost est un algorithme lié à la mémoire (par opposition au calcul). Par conséquent, une instance de calcul à usage général (par exemple, M5) constitue un meilleur choix qu'une instance optimisée pour le calcul (par exemple, C5). De plus, nous vous recommandons d'avoir suffisamment de mémoire totale dans les instances sélectionnées pour contenir les données d'entraînement.

CatBoost exemples de carnets

Le tableau suivant présente une variété d'exemples de blocs-notes qui répondent à différents cas d'utilisation de l' CatBoost algorithme Amazon SageMaker AI.

Titre du bloc-notes Description

Classification tabulaire avec Amazon SageMaker AI Light GBM et algorithme CatBoost

Ce carnet explique l'utilisation de l' CatBoostalgorithme Amazon SageMaker AI pour entraîner et héberger un modèle de classification tabulaire.

Régression tabulaire avec Amazon SageMaker AI Light GBM et algorithme CatBoost

Ce carnet explique l'utilisation de l' CatBoostalgorithme Amazon SageMaker AI pour entraîner et héberger un modèle de régression tabulaire.

Pour savoir comment créer et accéder à des instances de bloc-notes Jupyter que vous pouvez utiliser pour exécuter l'exemple dans SageMaker AI, consultez. Instances Amazon SageMaker Notebook Après avoir créé une instance de bloc-notes et l'avoir ouverte, choisissez l'onglet Exemples d'SageMaker IA pour voir la liste de tous les exemples d' SageMaker IA. Pour ouvrir un bloc-notes, choisissez son onglet Use (Utiliser), puis Create copy (Créer une copie).