LightGBM - 亚马逊 SageMaker AI

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

LightGBM

LightGBM 是梯度提升决策树 (GBDT) 算法的一种热门的开源实施,效率非常出色。GBDT 是一种有监督学习算法,它尝试将一组较简单且较弱模型的一系列估计值结合在一起,从而准确地预测目标变量。LightGBM 使用额外的技术来显著提高传统 GBDT 的效率和可扩展性。本页包含有关亚马逊 EC2 实例推荐和 LightGBM 示例笔记本的信息。

亚马逊推荐使用 LightGBM 算法的 EC2 实例

SageMaker AI LightGBM 目前支持单实例和多实例 CPU 训练。对于多实例 CPU 训练(分布式训练),请在定义估算器时指定大于 1 的 instance_count。有关使用 LightGBM 进行分布式训练的更多信息,请参阅使用 Dask 的 A mazon A SageMaker I LightGBM 分布式训练。

LightGBM 是一种内存限制型(而不是计算限制型)算法。因此,通用计算实例(例如 M5)是比计算优化型实例(例如 C5)更适合的选择。此外,我们建议您在选定的实例中有足够的总内存来保存训练数据。

LightGBM 示例笔记本

下表概述了各种示例笔记本,这些笔记本解决了 Amazon A SageMaker I LightGBM 算法的不同用例。

笔记本标题 描述

使用 Amazon A SageMaker I LightGBM 和算法进行表格分类 CatBoost

本笔记本演示了如何使用 Amazon A SageMaker I LightGBM 算法来训练和托管表格分类模型。

使用 Amazon A SageMaker I LightGBM 和算法进行表格回归 CatBoost

本笔记本演示了如何使用 Amazon A SageMaker I LightGBM 算法来训练和托管表格回归模型。

Amazon SageMaker AI LightGBM 使用 Dask 进行分布式训练

本笔记本演示了使用 Dask 框架使用 Amazon A SageMaker I LightGBM 算法进行分布式训练。

有关如何创建和访问可用于在 SageMaker AI 中运行示例的 Jupyter 笔记本实例的说明,请参阅。Amazon SageMaker 笔记本实例创建并打开笔记本实例后,选择 “SageMaker AI 示例” 选项卡以查看所有 SageMaker AI 示例的列表。要打开笔记本,请选择其使用选项卡,然后选择创建副本