本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
什麼是 SageMaker AI 專案?
SageMaker 專案可協助組織為資料科學家建立開發人員環境並實現標準化,以及為 MLOps 工程師建立 CI/CD 系統。專案也可協助組織設定相依性管理、程式碼儲存庫管理、建置可重複性,以及成品共用。
您可以使用自訂或 SageMaker AI 提供的範本,從 AWS Service Catalog 佈建 SageMaker 專案。如需 AWS Service Catalog 的相關資訊,請參閱什麼是 AWS Service Catalog。透過 SageMaker Projects,MLOps 工程師和組織管理員可以定義自己的範本,或使用 SageMaker AI 提供的範本。SageMaker AI 提供的範本透過來源版本控制、自動化 ML 管道和一組程式碼來引導 ML 工作流程,以快速開始在 ML 使用案例中反覆運算。
何時應使用 SageMaker AI 專案?
重要
自 2024 年 9 月 9 日起,不再支援使用 AWS CodeCommit 儲存庫的專案範本。對於新專案,請從使用第三方 Git 儲存庫的可用專案範本中選取 。
筆記本對於建立模型和實驗很有幫助,但共用程式碼的資料科學家和機器學習 (ML) 工程師團隊需要一種可擴展性更高的方式來維持程式碼一致性和嚴格的版本控制。
每個組織都有自己的一組標準和實務,為其 AWS 環境提供安全和控管。SageMaker AI 為想要快速開始使用 ML 工作流程和 CI/CD 的組織提供一組第一方範本。範本包含使用 CI/CD AWS原生服務的專案,例如 AWS CodeBuild AWS CodePipeline和 AWS CodeCommit。這些範本也提供建立使用第三方工具 (例如 Jenkins 和 GitHub) 之專案的選項。如需 SageMaker AI 提供的專案範本清單,請參閱 使用 SageMaker AI 提供的專案範本。
組織通常需要嚴格控制其佈建和管理的 MLOps 資源。此類責任需要承擔某些任務,包括設定 IAM 角色和政策、強制執行資源標籤、強制執行加密,以及跨多個帳戶對資源進行解耦。SageMaker Projects 可以透過自訂範本產品支援所有這些任務,其中組織會使用 AWS CloudFormation 範本來定義 ML 工作流程所需的資源。資料科學家可以選擇範本來引導和預先設定其機器學習 (ML) 工作流程。這些自訂範本會建立為 Service Catalog 產品,您可以在 Studio 或 Organization Templates 下的 Studio Classic UI 中佈建。Service Catalog 是一項服務,可協助組織建立和管理核准用於 的產品目錄 AWS。如需建立自訂範本的詳細資訊,請參閱建置自訂 SageMaker AI 專案範本 – 最佳實務
SageMaker 專案可協助您管理 Git 儲存庫,從而提高跨團隊共同作業效率、確保程式碼一致性,並支援 CI/CD。SageMaker 專案可協助您完成下列任務:
-
在一個專案下整理機器學習 (ML) 生命週期的所有實體。
-
為模型訓練和部署建立一鍵式方法來設定標準機器學習 (ML) 基礎設施,並將最佳實務納入其中。
-
建立和共用機器學習 (ML) 基礎設施範本,以處理多個使用案例。
-
利用 SageMaker AI 提供的預先建置範本,快速開始專注於模型建置,或使用組織特定的資源和指導方針建立自訂範本。
-
通過擴展項目範本與您選擇的工具集成。如需範例,請參閱建立要與 GitLab 和 GitLab Pipelines 整合的 SageMaker AI 專案 GitLab GitLab
。 -
在一個專案下整理機器學習 (ML) 生命週期的所有實體。
SageMaker AI 專案中的什麼內容?
客戶可以靈活地使用最適合其使用案例的資源來設定專案。以下範例展示機器學習工作流程的 MLOps 設定,包括模型訓練和部署。

具有 SageMaker AI 提供之範本的典型專案可能包括下列項目:
-
一個或多個包含範例程式碼的儲存庫,用於建置和部署機器學習 (ML) 解決方案。這些是您可以根據您的需求修改的工作範例。此程式碼歸您所有,您可以利用版本控制的儲存庫來完成自己的任務。
-
定義資料準備、訓練、模型評估和模型部署步驟的 SageMaker AI 管道,如下圖所示。
-
每次您檢查新版本的程式碼時,執行 SageMaker AI 管道的 CodePipeline 或 Jenkins 管道。如需 CodePipeline 的相關資訊,請參閱什麼是 AWS CodePipeline。如需與 Jenkins 相關的資訊,請參閱 Jenkins 使用者文件
。 -
包含模型版本的模型群組。每次從 SageMaker AI 管道執行核准產生的模型版本時,您都可以將其部署到 SageMaker AI 端點。
每個 SageMaker AI 專案都有唯一的名稱和 ID,會套用為專案中建立的所有 SageMaker AI AWS 和資源的標籤。使用名稱和 ID,您可以檢視與專案相關聯的所有實體。其中包含:
-
管道
-
已註冊模型
-
已部署模型 (端點)
-
資料集
-
Service Catalog 產品
-
CodePipeline 和 Jenkins 管道
-
CodeCommit 和第三方 Git 儲存庫
我需要建立專案才能使用 SageMaker AI 管道嗎?
否。SageMaker 管道是獨立的實體,例如訓練任務、處理任務和其他 SageMaker AI 任務。您可以使用 SageMaker Python SDK 直接在筆記本中建立、更新和執行管道,而無需使用 SageMaker AI 專案。
專案提供額外一個層級,可協助您整理程式碼,並採用生產品質系統所需的作業最佳實務。