本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
本入門教學課程會逐步引導您建立 SageMaker 筆記本執行個體、使用預先設定的核心開啟 Jupyter 筆記本,其中包含適用於機器學習的 Conda 環境,以及啟動 SageMaker AI 工作階段來執行end-to-end週期。您將了解如何將資料集儲存到預設的 Amazon S3 儲存貯體,自動與 SageMaker AI 工作階段配對、將 ML 模型的訓練任務提交至 Amazon EC2,並透過 Amazon EC2 託管或批次推論來部署訓練模型以進行預測。
本教學課程明確顯示從 SageMaker AI 內建模型集區訓練 XGBoost 模型的完整 ML 流程。您可以使用美國成人人口普查資料集
-
SageMaker AI XGBoost – XGBoost
模型已適應 SageMaker AI 環境,並預先設定為 Docker 容器。SageMaker AI 提供一套內建演算法,已準備好使用 SageMaker AI 功能。若要進一步了解哪些 ML 演算法適用於 SageMaker AI,請參閱選擇演算法和使用 Amazon SageMaker 內建演算法。如需 SageMaker AI 內建演算法 API 操作,請參閱 Amazon SageMaker Python SDK 中的第一方演算法 。 -
成人人口普查資料集
— 1994 年人口普查局資料庫 的資料集,由 Ronny Kohavi 和 Barry Becker (資料探勘與視覺化、矽晶圖形) 製作。SageMaker AI XGBoost 模型是使用此資料集進行訓練,以預測個人一年的收入是否超過 50,000 美元。