CatBoost - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CatBoost

CatBoost是梯度提升决策树 (GBDT) 算法的一种流行且高性能的开源实现。GBDT 是一种有监督学习算法,它尝试将一组较简单且较弱模型的一系列估计值结合在一起,从而准确地预测目标变量。

CatBoost 为 GBDT 引入了两项关键的算法改进:

  1. 实施了有序提升,这是对经典算法的以排列驱动的替代方案

  2. 用于处理分类特征的创新算法

这两种技术都是为了对抗由一种特殊目标泄漏所引起的预测偏移,这种偏移存在于梯度提升算法的所有现有实施中。本页包含有关 Amazon EC2 实例推荐和示例笔记本的信息 CatBoost。

该 CatBoost算法 EC2 的 Amazon 实例推荐

SageMaker 人工智能 CatBoost 目前仅使用训练 CPUs。 CatBoost 是一种内存绑定(而不是计算绑定)算法。因此,通用计算实例(例如 M5)是比计算优化型实例(例如 C5)更适合的选择。此外,我们建议您在选定的实例中有足够的总内存来保存训练数据。

CatBoost 示例笔记本

下表概述了各种示例笔记本,这些笔记本解决了 Amazon A SageMaker I CatBoost 算法的不同用例。

笔记本标题 描述

使用 Amazon A SageMaker I LightGBM 和算法进行表格分类 CatBoost

本笔记本演示了如何使用 Amazon SageMaker AI CatBoost 算法来训练和托管表格分类模型。

使用 Amazon A SageMaker I LightGBM 和算法进行表格回归 CatBoost

本笔记本演示了如何使用 Amazon SageMaker AI CatBoost 算法来训练和托管表格回归模型。

有关如何创建和访问可用于在 SageMaker AI 中运行示例的 Jupyter 笔记本实例的说明,请参阅。Amazon SageMaker 笔记本实例创建并打开笔记本实例后,选择 “SageMaker AI 示例” 选项卡以查看所有 SageMaker AI 示例的列表。要打开笔记本,请选择其使用选项卡,然后选择创建副本