翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker AI プロジェクトとは
SageMaker プロジェクトは、組織がデータサイエンティスト向けのデベロッパー環境や MLOps エンジニア向けの CI/CD システムをセットアップおよび標準化するのに役立ちます。また、組織が依存関係管理、コードリポジトリ管理、ビルド再現性、アーティファクト共有をセットアップする場合にも役立ちます。
カスタムテンプレートまたは SageMaker AI 提供のテンプレートを使用して、 AWS Service Catalog から SageMaker プロジェクトをプロビジョニングできます。 AWS Service Catalog の詳細については、AWS 「Service Catalog とは」を参照してください。SageMaker プロジェクトを使用すると、MLOps エンジニアと組織管理者は独自のテンプレートを定義するか、SageMaker AI が提供するテンプレートを使用できます。SageMaker AI が提供するテンプレートは、ソースバージョン管理、自動 ML パイプライン、および一連のコードを使用して ML ワークフローをブートストラップし、ML ユースケースの反復をすばやく開始します。
SageMaker AI プロジェクトをいつ使用すべきですか?
重要
2024 年 9 月 9 日以降、 AWS CodeCommit リポジトリを使用するプロジェクトテンプレートはサポートされなくなります。新しいプロジェクトでは、サードパーティーの Git リポジトリを使用する、利用可能なプロジェクトテンプレートから選択します。
ノートブックはモデルの構築や実験には便利ですが、コードを共有するデータサイエンティストや機械学習エンジニアのチームは、コードの一貫性と厳格なバージョン管理を維持するためのよりスケーラブルな手段を必要とします。
すべての組織には、 AWS 環境にセキュリティとガバナンスを提供する独自の標準とプラクティスのセットがあります。SageMaker AI は、ML ワークフローと CI/CD をすばやく開始したい組織向けに、一連のファーストパーティテンプレートを提供します。テンプレートには、、 AWS CodeBuild AWS CodePipeline、 などの CI/CD AWSにネイティブサービスを使用するプロジェクトが含まれます AWS CodeCommit。また、Jenkins や GitHub などのサードパーティーのツールを使用するプロジェクトを作成するオプションも含まれています。SageMaker AI が提供するプロジェクトテンプレートのリストについては、「」を参照してくださいSageMaker AI 提供のプロジェクトテンプレートを使用する。
多くの場合、組織は、MLOps リソースを厳密に制御してプロビジョニングおよび管理する必要があります。この場合、IAM ロールとポリシーの設定、リソースタグの適用、暗号化の適用、複数のアカウントでのリソースの分離などの特定のタスクを責任として引き受けます。SageMaker Projects は、組織がテンプレートを使用して ML ワークフローに必要なリソースを定義するカスタム AWS CloudFormation テンプレートサービスを通じて、これらのタスクをすべてサポートできます。データサイエンティストは、テンプレートを選択して機械学習ワークフローをブートストラップおよび事前設定できます。このようなカスタムテンプレートは、Service Catalog 製品として作成し、Studio UI または Studio Classic UI の [組織テンプレート] でプロビジョンできます。Service Catalog は、 での使用が承認された製品のカタログの作成と管理を支援するサービスです AWS。カスタムテンプレートの作成の詳細については、「カスタム SageMaker AI プロジェクトテンプレートの構築 – ベストプラクティス
SageMaker プロジェクトを使用すると、Git リポジトリが管理しやすくなり、チーム間でのコラボレーションの効率化、コードの一貫性の確保、CI/CD のサポートが可能になります。SageMaker プロジェクトは以下のタスクに役立ちます。
-
機械学習ライフサイクルのすべてのエンティティを 1 つのプロジェクトにまとめます。
-
シングルクリックアプローチを確立し、ベストプラクティスを反映したモデルのトレーニングとデプロイのための標準機械学習インフラストラクチャをセットアップします。
-
機械学習インフラストラクチャのテンプレートを作成して共有し、複数のユースケースに対応します。
-
SageMaker AI が提供する構築済みテンプレートを活用して、モデル構築にすばやく焦点を当てたり、組織固有のリソースとガイドラインを使用してカスタムテンプレートを作成したりできます。
-
プロジェクトテンプレートを拡張して、選択したツールと統合します。例については、「GitLab および GitLab Pipelines と統合する SageMaker AI GitLab プロジェクトを作成する
」を参照してください。 -
機械学習ライフサイクルのすべてのエンティティを 1 つのプロジェクトにまとめます。
SageMaker AI プロジェクトとは
お客様は、ユースケースに最適なリソースを使用して、プロジェクトを柔軟に設定できます。以下の例では、モデルのトレーニングやデプロイなど、機械学習ワークフローの MLOps のセットアップを示します。

SageMaker AI が提供するテンプレートを使用する一般的なプロジェクトには、次のようなものがあります。
-
機械学習ソリューションを構築およびデプロイするための 1 つ以上のリポジトリとサンプルコード。これらは実践的なサンプルです。必要に応じて変更できます。このコードを所有することで、バージョン管理されたリポジトリをタスクに利用できます。
-
次の図に示すように、データの準備、トレーニング、モデル評価、モデルデプロイの手順を定義する SageMaker AI パイプライン。
-
コードの新しいバージョンをチェックインするたびに SageMaker AI パイプラインを実行する CodePipeline または Jenkins パイプライン。CodePipeline の詳細については、AWS CodePipeline とは」を参照してください。Jenkins の詳細については、「Jenkins ユーザードキュメント
」を参照してください。 -
モデルバージョンを含むモデルグループ。SageMaker AI パイプラインの実行から結果のモデルバージョンを承認するたびに、SageMaker AI エンドポイントにデプロイできます。
各 SageMaker AI プロジェクトには一意の名前と ID があり、プロジェクトで作成されたすべての SageMaker AI と AWS リソースにタグとして適用されます。この名前と ID を使用すると、プロジェクトに関連付けられたすべてのエンティティを表示できます。具体的には次のとおりです。
-
Pipelines
-
登録済みのモデル
-
デプロイ済みのモデル (エンドポイント)
-
データセット
-
Service Catalog 製品
-
CodePipeline および Jenkins パイプライン
-
CodeCommit とサードパーティーの Git リポジトリ
SageMaker AI Pipelines を使用するにはプロジェクトを作成する必要がありますか?
いいえ。SageMaker パイプラインは、トレーニングジョブ、処理ジョブ、その他の SageMaker AI ジョブと同様にスタンドアロンエンティティです。SageMaker AI プロジェクトを使用せずに SageMaker Python SDK を使用して、ノートブック内でパイプラインを直接作成、更新SageMaker実行できます。
プロジェクトには、コードを整理したり、本番品質システムに必要な運用上のベストプラクティスを導入したりする際に役立つ追加のレイヤーが用意されています。