翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker HyperPod リファレンス
の使用に関する詳細とリファレンスについては、以下のトピック SageMaker HyperPod を参照してください。
トピック
SageMaker HyperPod 料金
以下のトピックでは、 SageMaker HyperPod 料金について説明します。 SageMaker HyperPod インスタンスを使用するための 1 時間あたりの料金の詳細については、「Amazon の SageMaker 料金
キャパシティリクエスト
オンデマンドまたはリザーブドコンピューティング容量を で SageMaker 使用するために に割り当てることができます SageMaker HyperPod。オンデマンドクラスターの作成では、オンデマンドキャパシティープールから使用可能なキャパシティーが SageMaker割り当てられます。または、クォータ引き上げのチケットを送信して、リザーブドキャパシティをリクエストしてアクセスを確保することもできます。インバウンドキャパシティーリクエストは によって優先 SageMaker され、キャパシティー割り当ての推定時間を受け取ります。
サービス請求
でコンピューティングキャパシティをプロビジョニングすると SageMaker HyperPod、キャパシティ割り当ての期間に対して課金されます。 SageMaker HyperPod の請求は、キャパシティ割り当てのタイプ (オンデマンド、リザーブド)、インスタンスタイプ、およびインスタンスの使用に費やされた時間の明細項目とともに記念日の請求書に表示されます。
クォータ引き上げのチケットを送信するには、「」を参照してくださいSageMaker HyperPod クォータ。
SageMaker HyperPod APIs
次のリストは、 SageMaker を介して に JSON 形式のアクションリクエストを送信するための の完全なセット SageMaker HyperPod APIsです。 AWS CLI または AWS SDK for Python (Boto3).
SageMaker HyperPod フォーム
で Slurm ワークロードマネージャーツールを設定するには HyperPod、提供されたフォーム HyperPod を使用して必要な Slurm 設定ファイルを作成する必要があります。
で Slurm ノードをプロビジョニングするための設定フォーム HyperPod
次のコードは、 HyperPod クラスターで Slurm ノードを適切にセットアップするために準備する必要がある Slurm 設定フォームです。このフォームに記入し、クラスターの作成時に一連のライフサイクルスクリプトの一部としてアップロードする必要があります。 HyperPod クラスター作成プロセス全体でこのフォームを準備する方法については、「」を参照してくださいライフサイクルスクリプトを使用してクラスターをカスタマイズ SageMaker HyperPodする。
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
– 必須。これはプロビジョニング HyperPod パラメータフォームのバージョンです。に保持します1.0.0
。 -
workload_manager
– 必須。これは、 HyperPod クラスターに設定するワークロードマネージャーを指定するためのものです。に保持しますslurm
。 -
controller_group
– 必須。これは、Slurm コントローラー (ヘッド) ノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。 -
login_group
- オプション。これは、Slurm ログインノードに割り当てる HyperPod クラスターインスタンスグループの名前を指定するためのものです。 -
worker_groups
– 必須。これは、 HyperPod クラスターで Slurm ワーカー (コンピューティング) ノードを設定するためのものです。-
instance_group_name
– 必須。これは、Slurm ワーカー (コンピューティング) ノードに割り当てる HyperPod インスタンスグループの名前を指定するためのものです。 -
partition_name
– 必須。これは、ノードにパーティション名を指定するためのものです。
-
-
fsx_dns_name
- オプション。Amazon と通信するように HyperPod クラスターで Slurm ノードを設定する場合はFSx、FSxDNS名前を指定します。 -
fsx_mountname
- オプション。Amazon と通信するように HyperPod クラスターで Slurm ノードを設定する場合はFSx、FSxマウント名を指定します。
SageMaker HyperPod DLAMI
SageMaker HyperPod は、以下DLAMIに基づいて を実行します。
-
AWS Slurm とオーケストレーションするための Deep Learning Base GPU AMI (Ubuntu 20.04)
。 -
Amazon Linux 2 ベースの Amazon とのAMIオーケストレーションEKS。
SageMaker HyperPod DLAMI には、Slurm、Kubernetes、依存関係、 SageMaker HyperPod クラスターのヘルスチェックや自動再開などの障害耐性機能をサポートするクラスターソフトウェアパッケージなどのオープンソースツールをサポートする追加のパッケージがバンドルされています。 HyperPod サービスチームが を通じて配布する HyperPod ソフトウェア更新のフォローアップについてはDLAMIs、「」を参照してくださいAmazon SageMaker HyperPod リリースノート。
SageMaker HyperPod API アクセス許可リファレンス
重要
Amazon SageMaker Studio または Amazon SageMaker Studio Classic が Amazon SageMaker リソースを作成できるようにするカスタムIAMポリシーでは、それらのリソースにタグを追加するアクセス許可も付与する必要があります。Studio と Studio Classic は、作成したリソースに自動的にタグ付けするため、リソースにタグを追加するアクセス許可が必要です。IAM ポリシーで Studio と Studio Classic がリソースの作成を許可しているが、タグ付けが許可されていない場合、リソースの作成時にAccessDenied「」エラーが発生する可能性があります。詳細については、「リソースにタグ付けするための SageMakerアクセス許可を提供する」を参照してください。
AWS Amazon のマネージドポリシー SageMaker SageMaker リソースを作成するアクセス許可を付与する には、それらのリソースの作成中にタグを追加するアクセス許可が既に含まれています。
によるオペレーションの実行 SageMaker HyperPod APIを許可し、クラウド管理者のIAMユーザーにアタッチできるアクセス許可ポリシーを記述するためのアクセスコントロールを設定する場合は、次の表を参照として使用します。
Amazon SageMaker API オペレーション | 必要なアクセス許可 (API アクション) | リソース |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
のアクセス許可とリソースタイプの詳細なリストについては SageMaker APIs、「」の「Amazon のアクション、リソース、および条件キー SageMaker」を参照してください。 AWS サービス認証リファレンス 。
SageMaker HyperPod の コマンド AWS CLI
以下は、 AWS CLI コアオペレーション SageMaker HyperPod を実行するための コマンド。 HyperPod API
SageMaker HyperPod の Python モジュール AWS SDK for Python (Boto3)
以下は、 のメソッドです。 AWS SDK for Python (Boto3) コアオペレーション を実行する SageMaker の クライアント。 HyperPod API