SageMaker HyperPod 클러스터 관리 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker HyperPod 클러스터 관리

다음 항목에서는 SageMaker HyperPod 클러스터 로깅 및 관리에 대해 설명합니다.

로깅 SageMaker HyperPod 이벤트

의 모든 이벤트와 로그는 로그 그룹 CloudWatch 이름으로 Amazon에 SageMaker HyperPod 저장됩니다/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. CreateClusterAPI를 호출할 때마다 새 로그 그룹이 생성됩니다. 다음 목록에는 각 로그 그룹에서 수집된 사용 가능한 모든 로그 스트림이 포함되어 있습니다.

로그 그룹 이름 로그 스트림 이름
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

인스턴스 SageMaker HyperPod 수준 로깅

클러스터 인스턴스 구성 CloudWatch 중에 게시된 LifecycleScript 로그에 액세스할 수 있습니다. 생성된 클러스터 내의 모든 인스턴스는 형식으로 구분되는 별도의 로그 스트림을 생성합니다. LifecycleConfig/[instance-group-name]/[instance-id]

기록된 모든 로그는 이전 CloudWatch 스트림에 /var/log/provision/provisioning.log 업로드됩니다. 샘플을 이 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-config위치로 stdout stderr 리디렉션할 LifecycleScripts 때 사용하십시오. 사용자 지정 스크립트를 사용하는 경우 해당 스크립트를 사용할 수 있는 /var/log/provision/provisioning.log 위치에 로그를 기록하십시오. CloudWatch

리소스에 태그 지정

AWS 태깅 시스템은 리소스를 관리, 식별, 구성, 검색 및 필터링하는 데 도움이 됩니다. SageMaker HyperPod 태깅을 지원하므로 클러스터를 리소스로 AWS 관리할 수 있습니다. 클러스터를 만들거나 기존 클러스터를 편집하는 동안 클러스터의 태그를 추가하거나 편집할 수 있습니다. 일반적인 태깅에 대한 자세한 내용은 리소스 태그 지정을 참조하십시오. AWS

콘솔 UI 사용 SageMaker HyperPod

새 클러스터를 생성하고 클러스터를 편집할 때 태그를 추가, 제거 또는 편집할 수 있습니다.

SageMaker HyperPod API 사용

JSON 형식으로 CreateCluster또는 UpdateClusterAPI 요청 파일을 작성하는 경우 섹션을 편집하십시오. Tags

AWS CLI 태깅 명령 사용: SageMaker

클러스터에 태그를 지정하려면

다음과 aws sagemaker add-tags같이 사용하세요.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

클러스터의 태그를 해제하려면

다음과 aws sagemaker delete-tags같이 사용하세요.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

리소스의 태그를 나열하려면

다음과 aws sagemaker list-tags같이 사용하세요.

aws sagemaker list-tags --resource-arn cluster_ARN