CatBoost - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CatBoost

CatBoost是梯度提升决策树 (GBDT) 算法的流行且高性能的开源实现。GBDT是一种监督学习算法,它试图通过组合来自一组更简单和更弱的模型的估计值来准确预测目标变量。

CatBoost 引入了两项关键的算法进步:GBDT

  1. 实施了有序提升,这是对经典算法的以排列驱动的替代方案

  2. 用于处理分类特征的创新算法

这两种技术都是为了对抗由一种特殊目标泄漏所引起的预测偏移,这种偏移存在于梯度提升算法的所有现有实施中。本页包含有关 Amazon EC2 实例推荐和示例笔记本的信息 CatBoost。

该 CatBoost算法EC2的 Amazon 实例推荐

SageMaker CatBoost 目前只有火车使用CPUs。 CatBoost 是一种内存绑定(而不是计算绑定)算法。因此,通用计算实例(例如 M5)是比计算优化型实例(例如 C5)更适合的选择。此外,我们建议您在选定的实例中有足够的总内存来保存训练数据。

CatBoost 样本笔记本

下表概述了解决亚马逊 SageMaker CatBoost 算法不同用例的各种示例笔记本。

笔记本标题 描述

使用 Amazon L SageMaker ight GBM 和 CatBoost 算法进行表格分类

本笔记本演示了如何使用 Amazon SageMaker CatBoost 算法来训练和托管表格分类模型。

使用 Amazon L SageMaker ight GBM 和 CatBoost 算法进行表格回归

本笔记本演示了如何使用 Amazon SageMaker CatBoost 算法来训练和托管表格回归模型。

有关如何创建和访问可用于在中运行示例的 Jupyter 笔记本实例的说明 SageMaker,请参阅。Amazon SageMaker 笔记本实例创建并打开笔记本实例后,选择 “SageMaker示例” 选项卡以查看所有 SageMaker 示例的列表。要打开笔记本,请选择其使用选项卡,然后选择创建副本