SageMaker HyperPod クラスター管理 - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SageMaker HyperPod クラスター管理

以下のトピックでは、 SageMaker HyperPod クラスターのログ記録と管理について説明します。

SageMaker HyperPod イベントのログ記録

からのすべてのイベントとログ SageMaker HyperPod は、ロググループ名 CloudWatch で Amazon に保存されます/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]。を呼び出すたびに、新しいロググループCreateClusterAPIが作成されます。次のリストには、各ロググループで収集された使用可能なログストリームがすべて含まれています。

ロググループ名 ログストリーム名
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

SageMaker HyperPod インスタンスレベルでのログ記録

クラスターインスタンスの設定 CloudWatch 中に に発行された LifecycleScript ログにアクセスできます。作成されたクラスター内の各インスタンスは、LifecycleConfig/[instance-group-name]/[instance-id] 形式によって区別できる別個のログストリームを生成します。

に書き込まれたすべてのログ/var/log/provision/provisioning.logは、前の CloudWatch ストリームにアップロードされます。 LifecycleScripts のサンプルは、 stdout と をこの場所に1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configリダイレクトstderrします。カスタムスクリプトを使用している場合は、ログを /var/log/provision/provisioning.logの場所に書き込み、使用可能な状態にします CloudWatch。

リソースのタグ付け

AWS タグ付けシステムは、リソースの管理、識別、整理、検索、フィルタリングに役立ちます。 はタグ付け SageMaker HyperPod をサポートしているため、 リソースとして AWS クラスターを管理できます。既存のクラスターの作成または編集中に、クラスターのタグを追加または編集できます。タグ付け全般の詳細については、「AWS リソースのタグ付け」を参照してください。

SageMaker HyperPod コンソール UI の使用

新しいクラスターを作成するときとクラスターを編集するとき、タグを追加、削除、または編集できます。

の使用 SageMaker HyperPod APIs

CreateCluster または UpdateClusterAPIリクエストファイルを JSON形式で書き込む場合は、 Tagsセクションを編集します。

SageMaker AI の AWS CLI タグ付けコマンドの使用

クラスターにタグを付けるには

aws sagemaker add-tags を次のように使用します。

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

クラスターのタグを解除するには

aws sagemaker delete-tags を次のように使用します。

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

リソースのタグを一覧表示するには

aws sagemaker list-tags を次のように使用します。

aws sagemaker list-tags --resource-arn cluster_ARN