LightGBM - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

LightGBM

LightGBM 是梯度增強決策樹 (GBDT) 演算法的一種熱門且高效率的開放原始碼實作。GBDT 是一種監督式學習演算法,藉由結合一組較簡單且較脆弱的模型之預估值集合來嘗試準確地預測目標變數。LightGBM 使用其他技術來大幅改善傳統 GBDT 的效率和可擴展性。此頁面包含有關 LightGBM 的 Amazon EC2 執行個體建議和範例筆記本的資訊。

適用於 LightGBM 演算法的 Amazon EC2 執行個體推薦服務

SageMaker AI LightGBM 目前支援單一執行個體和多執行個體 CPU 訓練。對於多執行個體 CPU 訓練 (分散式訓練),請在定義估算器時指定大於 1 的 instance_count。如需使用 LightGBM 進行分散式訓練的詳細資訊,請參閱使用 Dask 的 Amazon SageMaker AI LightGBM 分散式訓練

LightGBM 為記憶體限制型 (相對於運算限制型) 演算法。因此,相較於運算最佳化執行個體 (例如 C4),一般用途的運算執行個體 (例如 M5) 是較好的選擇。此外,我們建議您在所選執行個體中需有足夠的總記憶體才可保留訓練資料。

LightGBM 範例筆記本

下表概述各種範例筆記本,這些筆記本可解決 Amazon SageMaker AI LightGBM 演算法的不同使用案例。

筆記本標題 Description

使用 Amazon SageMaker AI LightGBM 和 CatBoost 演算法進行表格式分類

此筆記本示範如何使用 Amazon SageMaker AI LightGBM 演算法來訓練和託管表格式分類模型。

使用 Amazon SageMaker AI LightGBM 和 CatBoost 演算法的表格式迴歸

此筆記本示範使用 Amazon SageMaker AI LightGBM 演算法來訓練和託管表格式迴歸模型。

使用 Dask 的 Amazon SageMaker AI LightGBM 分散式訓練

此筆記本示範使用 Dask 架構搭配 Amazon SageMaker AI LightGBM 演算法的分散式訓練。

如需如何建立和存取 Jupyter 筆記本執行個體的指示,您可以使用這些執行個體在 SageMaker AI 中執行範例,請參閱 Amazon SageMaker 筆記本執行個體。在您建立並開啟筆記本執行個體之後,請選擇 SageMaker AI 範例索引標籤以查看所有 SageMaker AI 範例的清單。若要開啟筆記本,請選擇其使用標籤,然後選擇建立複本