SageMaker HyperPod コンソール UI の使用 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod コンソール UI の使用

以下のトピックでは、コンソール UI を使用して SageMaker HyperPod を管理する方法に関するガイダンスを提供します。

SageMaker HyperPod クラスターを作成する

SageMaker HyperPod コンソール UI を使用して新しい SageMaker HyperPod クラスターを作成する方法については、次の手順を参照してください。

  1. https://console.aws.amazon.com/sagemaker/ で Amazon SageMaker AI コンソールを開きます。

  2. 左のナビゲーションペインで [HyperPod クラスター] を選択します。

  3. SageMaker HyperPod ランディングページで、[HyperPod クラスターを作成] を選択します。

  4. [HyperPod クラスターを作成] のドロップダウンメニューから、[Slurm によるオーケストレーション] を選択します。

  5. [ステップ 1: クラスター設定] で、クラスターの基本情報を設定します。

    1. [クラスター名] では、クラスターの名前を入力します。

    2. タグでは、新しいクラスターにキーと値のペアを追加し、クラスターを AWS リソースとして管理します。詳細については、「 AWS リソースのタグ付け」を参照してください。

  6. [ステップ 2: インスタンスグループ] で、[インスタンスグループを作成] を選択します。インスタンスグループごとに異なる方法で設定でき、さまざまなインスタンスタイプを持つ複数のインスタンスグループで構成される異種クラスターを作成できます。[インスタンスグループを作成] 設定ポップアップウィンドウで、インスタンスグループ設定情報を入力します。

    1. [インスタンスグループ名] で、インスタンスグループの名前を指定します。

    2. [インスタンスタイプを選択] で、インスタンスグループのインスタンスを選択します。

    3. [数量] で、クラスターの使用についてインスタンスクォータを超えない整数を指定します。

    4. [ライフサイクルスクリプトファイルへの Amazon S3 パス] に、ライフサイクルスクリプトが保存されている S3 パスを入力します。

    5. [作成時のライフサイクルスクリプトへのディレクトリパス][ライフサイクルスクリプトファイルへの S3 パス] の下に、ライフサイクルスクリプトのファイル名を入力します。

    6. IAM ロールの場合、セクション「AWS Identity and Access Management SageMaker HyperPod 用の」に従って、SageMaker HyperPod リソース用に作成した IAM ロールを選択します。

    7. [詳細設定] では、次のオプション設定を設定できます。

      1. (オプション) [コアごとのスレッド] で、マルチスレッドを無効にする場合は 1 を、マルチスレッドを有効にする場合は 2 を指定します。マルチスレッドをサポートするインスタンスタイプを確認するには、「Amazon EC2 ユーザーガイド」でインスタンスタイプごとの CPU コア数と CPU コアあたりのスレッド数のリファレンステーブルを参照してください。

      2. (オプション) [追加のインスタンスストレージ設定] で、1~16384 の整数を指定して、追加の Elastic Block Store (EBS) ボリュームのサイズをギガバイト (GB) 単位で設定します。EBS ボリュームは、インスタンスグループの各インスタンスにアタッチされます。追加の EBS ボリュームのデフォルトのマウントパスは /opt/sagemaker です。クラスターが正常に作成されたら、クラスターインスタンス (ノード) に SSH 接続し、df -h コマンドを実行して EBS ボリュームが正しくマウントされているかどうかを確認できます。追加の EBS ボリュームをアタッチすると、「Amazon Elastic Block Store ユーザーガイド」の「Amazon EBS ボリューム」セクションで説明されているように、インスタンスから独立した永続性を持つ安定したストレージが実現します。

  7. [ステップ 3: 詳細設定] で、クラスター内およびクラスターを出入りするオプションのネットワーク設定を設定します。SageMaker AI に VPC の下のリソースへのアクセスを許可する VPC が既にある場合は、独自の VPC を選択します。新しい VPC を作成する場合、「Amazon Virtual Private Cloud ユーザーガイド」の「Create a default VPC」または「Create a VPC」を参照してください。選択を行わない場合、アカウントのデフォルトの VPC が取得されます。

    注記

    独自の VPC を使用する場合、SageMaker HyperPod クラスターの IAM ロールにアクセス許可を追加する必要があります。詳細については、「Amazon VPC で SageMaker HyperPod をセットアップする」を参照してください。

  8. [ステップ 4: 確認および作成] で、ステップ 1 からステップ 3 において設定した内容を確認し、クラスター作成リクエストの送信を完了します。

  9. クラスターのステータスが InService になったら、クラスターノードへのログインを開始できます。クラスターノードにアクセスして ML ワークロードの実行を開始するには、「SageMaker HyperPod クラスター上のジョブ」を参照してください。

SageMaker HyperPod クラスターを参照する

SageMaker HyperPod コンソールのメインページの [クラスター] の下に、作成されたすべてのクラスターが一覧表示されます。[クラスター] セクションには、クラスター、その ARN、ステータス、作成時刻の概要が表示されます。

各 SageMaker HyperPod クラスターの詳細を表示する

コンソールのメインページの [クラスター] では、クラスターの [名前] がリンクとしてアクティブ化されます。クラスター名リンクを選択すると、各クラスターの詳細が表示されます。

SageMaker HyperPod クラスターを編集する

  1. [クラスター] で、更新するクラスターを選択します。

  2. [アクション] ボタンを選択し、[クラスターの編集] を選択します。

  3. [<your-cluster> の編集] ページで、既存のインスタンスグループの設定を編集したり、インスタンスグループを追加したり、クラスターのタグを変更したりすることができます。変更を加えたら、[次へ] を選択します。現在のところ、既存のインスタンスグループを縮小または削除することはできません。

    1. [インスタンスグループを設定] セクションで、[クラスターグループの作成] を選択して、インスタンスグループを追加できます。

    2. [インスタンスグループの設定] セクションで、いずれかのインスタンスグループのを選択し、[編集] を選択して設定を変更できます。

    3. [タグ] セクションでは、クラスターのタグを更新できます。

SageMaker HyperPod クラスターを削除する

  1. [クラスター] で、削除するクラスターを選択します。

  2. [アクション] を選択し、[クラスターを削除] を選択します。

  3. クラスター削除のポップアップウィンドウで、クラスター情報をよく確認し、削除する適切なクラスターが選択されていることを確認します。

  4. クラスター情報を確認したら、[はい、クラスターを削除します] を選択します。

  5. この削除を確認するテキストフィールドに、「delete」と入力します。

  6. ポップアップウィンドウの右下隅にある [削除] を選択して、クラスター削除リクエストの送信を完了します。