CatBoost - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

CatBoost

CatBoostist eine beliebte und leistungsstarke Open-Source-Implementierung des Gradient Boosting Decision Tree () GBDT -Algorithmus. GBDTist ein Algorithmus für überwachtes Lernen, der versucht, eine Zielvariable genau vorherzusagen, indem er ein Ensemble von Schätzungen aus einer Reihe einfacherer und schwächerer Modelle kombiniert.

CatBoost führt zwei wichtige algorithmische Fortschritte ein, umGBDT:

  1. Die Implementierung von Ordered Boosting, einer permutationsgesteuerten Alternative zum klassischen Algorithmus

  2. Ein innovativer Algorithmus zur Verarbeitung kategorischer Features

Beide Techniken wurden entwickelt, um einer Verschiebung der Voraussage entgegenzuwirken, die durch eine besondere Art von Zielleckage verursacht wird, die in allen derzeit vorhandenen Implementierungen von Gradienten-Boosting-Algorithmen auftritt. Diese Seite enthält Informationen zu EC2 Amazon-Instance-Empfehlungen und Beispielnotizbüchern für CatBoost.

EC2Amazon-Instance-Empfehlung für den CatBoost Algorithmus

SageMaker CatBoost derzeit nur Züge mitCPUs. CatBoost ist ein speichergebundener (im Gegensatz zu rechengebundenem) Algorithmus. Daher ist eine Allzweck-Datenverarbeitungs-Instance (z. B. M5) die bessere Wahl gegenüber einer für Datenverarbeitung optimierten Instance (z. B. C5). Des Weiteren empfehlen wir, dass Sie in ausgewählten Instances genügend Gesamtspeicher zur Verfügung haben, um das Trainingsdaten aufzunehmen.

CatBoost Beispiel-Notizbücher

In der folgenden Tabelle sind verschiedene Beispielnotizbücher aufgeführt, die sich mit verschiedenen Anwendungsfällen des SageMaker CatBoost Amazon-Algorithmus befassen.

Titel des Notebooks Beschreibung

Tabellarische Klassifizierung mit Amazon SageMaker Light GBM und Algorithmus CatBoost

Dieses Notizbuch demonstriert die Verwendung des SageMaker CatBoost Amazon-Algorithmus zum Trainieren und Hosten eines tabellarischen Klassifikationsmodells.

Tabellarische Regression mit Amazon SageMaker Light GBM und Algorithmus CatBoost

Dieses Notizbuch demonstriert die Verwendung des SageMaker CatBoost Amazon-Algorithmus zum Trainieren und Hosten eines tabellarischen Regressionsmodells.

Anweisungen zum Erstellen und Zugreifen auf Jupyter-Notebook-Instances, in denen Sie das Beispiel ausführen können, finden Sie unter. SageMaker Amazon SageMaker Notebook-Instances Nachdem Sie eine Notebook-Instanz erstellt und geöffnet haben, wählen Sie die Registerkarte SageMakerBeispiele, um eine Liste aller Beispiele anzuzeigen. SageMaker Zum Öffnen eines Notebooks wählen Sie die Registerkarte Verwenden und dann Kopie erstellen aus.