Amazon SageMaker Autopilot 筆記本範例 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker Autopilot 筆記本範例

下列筆記本提供可處理 Autopilot 各種使用案例的實用實作範例。

您可以在 SageMaker GitHub 範例儲存庫autopilot目錄中找到 Autopilot 的所有筆記本。

我們建議您在 Studio Classic 中複製完整的 Git 儲存庫,以直接存取和執行筆記本。如需有關如何在 Studio Classic 中複製 Git 儲存庫的資訊,請參閱 在 SageMaker Studio Classic 中複製 Git 儲存庫

使用案例 Description
無伺服器推論

根據預設,Autopilot 可讓您將產生的模型部署到即時推論端點。在這個儲存庫中,筆記本會說明如何將使用 ENSEMBLINGHYPERPARAMETER OPTIMIZATION (HPO) 模式訓練的 Autopilot 模型部署到無伺服器端點。無伺服器端點會自動啟動運算資源,並根據流量進行縮減與擴增,無需選擇執行個體類型或管理擴展政策。

自訂功能選擇

Autopilot 會檢查您的資料集並執行多個候選項目,以找出資料預先處理步驟、機器學習演算法和超參數的最佳組合。您可以輕鬆部署在即時端點上或進行批次處理。

在某些情況下,您可能希望將自訂資料處理程式碼提供給 Autopilot 時具有彈性。例如,您的資料集可能包含大量獨立變數,您可能希望合併自訂功能選擇步驟,先移除不相關的變數。然後,可以使用產生的較小型資料集啟動一個 Autopilot 任務。最後,您還希望同時包含 Autopilot 的自訂處理程式碼和模型,進行即時或批次處理。

Pipeline 範例

雖然 Autopilot 簡化了建置 ML 模型的程序,但MLOps工程師仍需負責建立、自動化和管理 end-to-end生產中的 ML 工作流程。 SageMaker Pipelines 可協助自動化 ML 生命週期的各個步驟,例如資料預先處理、模型訓練、超參數調校、模型評估和部署。此筆記本示範如何將 Autopilot 納入 SageMaker Pipelines end-to-end AutoML 訓練工作流程。若要在 Pipelines 內啟動 Autopilot 實驗,您必須使用 Pipelines LambdaProcessing 步驟寫入自訂整合程式碼,才能建立模型建置工作流程。如需詳細資訊,請參閱使用 Amazon Pipelines 將 Amazon SageMaker SageMaker Autopilot ML 模型從實驗移至生產

或者,在組合模式下使用 Autopilot 時,您可以參考筆記本範例,示範如何在 Pipeline 的原生 AutoML 步驟 中使用原生 AutoML 步驟。 SageMaker AutoML 使用支援的 Autopilot 作為管道中的原生步驟,您現在可以將自動訓練步驟 (A) utoMLStep新增至管道,並在組合模式下叫用 Autopilot 實驗。

Amazon SageMaker Autopilot 的直接行銷

本筆記本示範如何使用銀行行銷資料集來預測客戶是否會註冊銀行的定期存款。您可以在此資料集上使用 Autopilot,探索各種管道候選項目所包含的選項以取得最準確的機器學習 (ML) 管道。Autopilot 會在雙步驟的程序中產生每個候選項目。第一個步驟會在資料集上執行自動化功能工程設計。第二個步驟會訓練並調校演算法以產生模型。此筆記本包含說明如何訓練模型以及如何部署模型,以使用最佳候選項目執行批次推論的相關指示。

使用 Amazon SageMaker Autopilot 的客戶流失預測

本筆記本說明使用機器學習自動識別不滿意的客戶,也稱為客戶流失預測。此範例說明如何分析可公開取得的資料集,以及在該資料集上執行功能工程設計。接著,它說明如何選取最佳效能的管道以及訓練演算法的最佳超參數來調校模型。最後,它說明如何將模型部署到託管端點,並根據基本事實如何評估其預測。但是,機器學習 (ML) 模型很少給出完美的預測。這就是這個筆記本也在說明如何在確定使用機器學習 (ML) 的財務結果時,合併預測錯誤之相對成本的原因。

使用 Amazon SageMaker Autopilot 和批次轉換 (Python SDK) 進行客戶流失預測的熱門候選者

本筆記本也說明使用機器學習自動識別不滿意的客戶,也稱為客戶流失預測。這個筆記本示範如何設定模型以取得推論機率、選取前 N 個模型,以及在保留測試集上進行批次轉換以進行評估。

注意

此筆記本適用於 6/19/2020 發行的 SageMaker Python SDK >= 1.65.1。

將您自己的資料處理程式碼帶至 Amazon SageMaker Autopilot

此筆記本示範如何在使用 Amazon SageMaker Autopilot 時整合和部署自訂資料處理程式碼。它新增一個自訂功能選擇步驟,以移除與 Autopilot 任務不相關的變數。然後,它會示範如何在即時端點上部署 Autopilot 所產生的自訂處理程式碼和模型,或者,進行批次處理。

更多筆記本

您可以在根目錄中找到更多說明其他使用案例的筆記本,例如批次轉換時間序列預測等。