SageMaker HyperPod クラスター管理 - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod クラスター管理

以下のトピックでは、 SageMaker HyperPod クラスターのログ記録と管理について説明します。

SageMaker HyperPod イベントのログ記録

からのすべてのイベントとログ SageMaker HyperPod は、ロググループ名 CloudWatch で Amazon に保存されます/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]CreateCluster API を呼び出すたびに、新しいロググループが作成されます。次のリストには、各ロググループで収集された利用可能なすべてのログストリームが含まれています。

ロググループ名 ログストリーム名
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

SageMaker HyperPod インスタンスレベルでのログ記録

クラスターインスタンスの設定 CloudWatch 中に に発行された LifecycleScript ログにアクセスできます。作成されたクラスター内のすべてのインスタンスは、 LifecycleConfig/[instance-group-name]/[instance-id]形式で区別できる個別のログストリームを生成します。

に書き込まれたすべてのログは、前の CloudWatch ストリームにアップロード/var/log/provision/provisioning.logされます。 LifecycleScripts のサンプル は、 stdoutstderr をこの場所に1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configリダイレクトします。カスタムスクリプトを使用している場合は、 で利用できるようにログを の/var/log/provision/provisioning.log場所に書き込みます CloudWatch。

リソースのタギング

AWS タグ付けシステムは、リソースの管理、識別、整理、検索、フィルタリングに役立ちます。 はタグ付け SageMaker HyperPod をサポートしているため、クラスターを リソースとして AWS 管理できます。クラスターの作成時または既存のクラスターの編集時に、クラスターのタグを追加または編集できます。タグ付け全般の詳細については、「 AWS リソースにタグを付ける」を参照してください。

SageMaker HyperPod コンソール UI の使用

新しいクラスターを作成しクラスター を編集するときに、タグを追加、削除、または編集できます。

SageMaker HyperPod APIs

CreateCluster または UpdateCluster API リクエストファイルを JSON 形式で記述する場合は、 Tagsセクションを編集します。

の AWS CLI タグ付けコマンドの使用 SageMaker

クラスターにタグを付けるには

aws sagemaker add-tags 次のように を使用します。

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

クラスターのタグを解除するには

aws sagemaker delete-tags 次のように を使用します。

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

リソースのタグを一覧表示するには

aws sagemaker list-tags 次のように を使用します。

aws sagemaker list-tags --resource-arn cluster_ARN