SageMaker HyperPod クラスターを作成する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod クラスターを作成する

EKS を使用して AWS Amazon によってオーケストレーションされた SageMaker HyperPod クラスターを作成する方法について説明しますCLI。

  1. SageMaker HyperPod クラスターを作成する前に:

    1. 既存の Amazon EKSクラスターが稼働していることを確認します。Amazon EKSクラスターのセットアップ方法の詳細については、「Amazon EKSユーザーガイド」の「Amazon EKSクラスターの作成」を参照してください。

    2. 「」の指示に従って Helm チャートをインストールしますHelm を使用して Amazon EKSクラスターにパッケージをインストールする

  2. ライフサイクル設定スクリプトを準備し、 などの Amazon S3 バケットにアップロードしますs3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/

    クイックスタートのために、 AWS ome Distributed Training GitHub リポジトリon_create.shからサンプルスクリプトをダウンロードし、S3 バケットにアップロードします。このスクリプトは、Pod コンテナからログを収集/var/log/provision/provisioning.log CloudWatch するために必要なログファイルを設定します。追加のセットアップ手順、一連のセットアップスクリプト、または HyperPod クラスタープロビジョニング段階で実行されるコマンドを含めることもできます。

    重要

    管理対象の のみをIAM の ロール SageMaker HyperPodアタッチする を作成するとAmazonSageMakerClusterInstanceRolePolicy、クラスターは特定のプレフィックス を持つ Amazon S3 バケットにアクセスできますsagemaker-

  3. JSON 形式のCreateClusterAPIリクエストファイルを準備します。にはExecutionRole、 セクション AmazonSageMakerClusterInstanceRolePolicy から で管理して作成したIAMロールARNの を指定しますIAM の ロール SageMaker HyperPod

    注記

    SageMaker HyperPod クラスターが Amazon EKSクラスターと同じ Virtual Private Cloud (VPC) 内にデプロイされていることを確認します。 SageMaker HyperPod クラスター設定で指定されたサブネットとセキュリティグループは、Amazon EKSクラスターのAPIサーバーエンドポイントとのネットワーク接続と通信を許可する必要があります。

    // create_cluster.json { "ClusterName": "string", "InstanceGroups": [{ "InstanceGroupName": "string", "InstanceType": "string", "InstanceCount": number, "LifeCycleConfig": { "SourceS3Uri": "s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/", "OnCreate": "on_create.sh" }, "ExecutionRole": "string", "ThreadsPerCore": number, "OnStartDeepHealthChecks": [ "InstanceStress", "InstanceConnectivity" ] }], "VpcConfig": { "SecurityGroupIds": ["string"], "Subnets": ["string"] }, "Tags": [{ "Key": "string", "Value": "string" }], "Orchestrator": { "Eks": { "ClusterArn": "string", } }, "NodeRecovery": "Automatic" }

    クラスターに関連付ける新しい SageMaker HyperPod クラスターを作成するように を設定するときは、次の点に注意してくださいEKS。

    • InstanceGroups パラメータでは、最大 20 個のインスタンスグループを設定できます。

    • ではOrchestator.Eks.ClusterArn、オーケストレーターとして使用するEKSクラスターARNの を指定します。

    • ではOnStartDeepHealthChecksInstanceStress InstanceConnectivityと を追加して を有効にしますディープヘルスチェック

    • ではNodeRecovery、ヘルスモニタリングエージェントによって問題が見つかったときに、 を指定Automaticして自動ノードリカバリを有効にします。 はインスタンス (ノード) を SageMaker HyperPod 置き換えるか再起動します。

    • Tags パラメータには、 SageMaker HyperPod クラスターを AWS リソースとして管理するためのカスタムタグを追加できます。タグは、タグ付けをサポートする他の AWS サービスでタグを追加するのと同じ方法でクラスターに追加できます。リソースのタグ付け全般の詳細については、 AWS 「リソースのタグ付けユーザーガイド AWS」を参照してください。

    • VpcConfig パラメータには、EKSクラスターVPCで使用される の情報を指定します。サブネットはプライベートである必要があります。

  4. create-cluster コマンドを次のように実行します。

    aws sagemaker create-cluster \ --cli-input-json file://complete/path/to/create_cluster.json

    これにより、新しいクラスターARNの が返されます。