CatBoost - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

CatBoost

CatBoostest une implémentation open source populaire et performante de l'algorithme Gradient Boosting Decision Tree (GBDT). GBDTest un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations issues d'un ensemble de modèles plus simples et plus faibles.

CatBoost introduit deux avancées algorithmiques essentielles pour GBDT :

  1. L'implémentation d'un renforcement ordonné, une alternative à l'algorithme classique axée sur la permutation

  2. Un algorithme innovant pour le traitement des caractéristiques catégorielles

Les deux techniques ont été créées pour lutter contre un changement de prédiction causé par un type particulier de fuite de cible présent dans toutes les implémentations existantes des algorithmes avec renforcement de gradient. Cette page contient des informations sur les recommandations relatives aux EC2 instances Amazon et des exemples de blocs-notes pour CatBoost.

Recommandation d'EC2instance Amazon pour l' CatBoostalgorithme

SageMaker CatBoost actuellement, seuls les trains empruntentCPUs. CatBoost est un algorithme lié à la mémoire (par opposition à un algorithme lié au calcul). Par conséquent, une instance de calcul à usage général (par exemple, M5) constitue un meilleur choix qu'une instance optimisée pour le calcul (par exemple, C5). De plus, nous vous recommandons d'avoir suffisamment de mémoire totale dans les instances sélectionnées pour contenir les données d'entraînement.

CatBoost exemples de carnets

Le tableau suivant présente une variété d'exemples de blocs-notes qui répondent à différents cas d'utilisation de l' SageMaker CatBoost algorithme Amazon.

Titre du bloc-notes Description

Classification tabulaire avec Amazon SageMaker Light GBM et algorithme CatBoost

Ce carnet explique l'utilisation de l' SageMaker CatBoostalgorithme Amazon pour entraîner et héberger un modèle de classification tabulaire.

Régression tabulaire avec Amazon SageMaker Light GBM et algorithme CatBoost

Ce carnet explique l'utilisation de l' SageMaker CatBoostalgorithme Amazon pour entraîner et héberger un modèle de régression tabulaire.

Pour obtenir des instructions sur la création et l'accès aux instances de bloc-notes Jupyter dans lesquelles vous pouvez exécuter l'exemple SageMaker, consultez. Instances Amazon SageMaker Notebook Après avoir créé une instance de bloc-notes et l'avoir ouverte, cliquez sur l'onglet SageMakerExemples pour afficher la liste de tous les SageMaker exemples. Pour ouvrir un bloc-notes, choisissez son onglet Use (Utiliser), puis Create copy (Créer une copie).