本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker Autopilot 筆記本範例
下列筆記本提供可處理 Autopilot 各種使用案例的實用實作範例。
您可以在 SageMaker GitHub 範例儲存庫autopilot
我們建議您在 Studio Classic 中複製完整的 Git 儲存庫,以直接存取和執行筆記本。如需有關如何在 Studio Classic 中複製 Git 儲存庫的資訊,請參閱 在 SageMaker Studio Classic 中複製 Git 儲存庫。
使用案例 | Description |
---|---|
無伺服器推論 |
根據預設,Autopilot 可讓您將產生的模型部署到即時推論端點。在這個儲存庫中,筆記本會說明如何將使用 |
Autopilot 會檢查您的資料集並執行多個候選項目,以找出資料預先處理步驟、機器學習演算法和超參數的最佳組合。您可以輕鬆部署在即時端點上或進行批次處理。 在某些情況下,您可能希望將自訂資料處理程式碼提供給 Autopilot 時具有彈性。例如,您的資料集可能包含大量獨立變數,您可能希望合併自訂功能選擇步驟,先移除不相關的變數。然後,可以使用產生的較小型資料集啟動一個 Autopilot 任務。最後,您還希望同時包含 Autopilot 的自訂處理程式碼和模型,進行即時或批次處理。 |
|
雖然 Autopilot 簡化了建置 ML 模型的程序,但MLOps工程師仍需負責建立、自動化和管理 end-to-end生產中的 ML 工作流程。 SageMaker Pipelines 可協助自動化 ML 生命週期的各個步驟,例如資料預先處理、模型訓練、超參數調校、模型評估和部署。此筆記本示範如何將 Autopilot 納入 SageMaker Pipelines end-to-end AutoML 訓練工作流程。若要在 Pipelines 內啟動 Autopilot 實驗,您必須使用 Pipelines Lambda 或 Processing 步驟寫入自訂整合程式碼,才能建立模型建置工作流程。如需詳細資訊,請參閱使用 Amazon Pipelines 將 Amazon SageMaker SageMaker Autopilot ML 模型從實驗移至生產 或者,在組合模式下使用 Autopilot 時,您可以參考筆記本範例,示範如何在 Pipeline 的原生 AutoML 步驟 中使用原生 AutoML 步驟。 SageMaker AutoML |
|
Amazon SageMaker Autopilot 的直接行銷 |
本筆記本示範如何使用銀行行銷資料集 |
使用 Amazon SageMaker Autopilot 的客戶流失預測 |
本筆記本說明使用機器學習自動識別不滿意的客戶,也稱為客戶流失預測。此範例說明如何分析可公開取得的資料集,以及在該資料集上執行功能工程設計。接著,它說明如何選取最佳效能的管道以及訓練演算法的最佳超參數來調校模型。最後,它說明如何將模型部署到託管端點,並根據基本事實如何評估其預測。但是,機器學習 (ML) 模型很少給出完美的預測。這就是這個筆記本也在說明如何在確定使用機器學習 (ML) 的財務結果時,合併預測錯誤之相對成本的原因。 |
使用 Amazon SageMaker Autopilot 和批次轉換 (Python SDK) 進行客戶流失預測的熱門候選者 |
本筆記本也說明使用機器學習自動識別不滿意的客戶,也稱為客戶流失預測。這個筆記本示範如何設定模型以取得推論機率、選取前 N 個模型,以及在保留測試集上進行批次轉換以進行評估。 注意此筆記本適用於 6/19/2020 發行的 SageMaker Python SDK >= 1.65.1。 |
將您自己的資料處理程式碼帶至 Amazon SageMaker Autopilot |
此筆記本示範如何在使用 Amazon SageMaker Autopilot 時整合和部署自訂資料處理程式碼。它新增一個自訂功能選擇步驟,以移除與 Autopilot 任務不相關的變數。然後,它會示範如何在即時端點上部署 Autopilot 所產生的自訂處理程式碼和模型,或者,進行批次處理。 |
更多筆記本 |