기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
다음은 Amazon SageMaker HyperPod EKS 클러스터 작업에 대한 정보를 제공합니다. 작업은 클러스터로 전송되는 작업 또는 작업입니다. 훈련, 실험 실행 또는 추론과 같은 기계 학습 작업일 수 있습니다. 볼 수 있는 작업 세부 정보 목록에는 상태, 실행 시간 및 작업당 사용되는 컴퓨팅 양이 포함됩니다.
Amazon SageMaker AI 콘솔
관리자 이외의 사용자가 작업 탭을 볼 수 있으려면 관리자가 IAM 역할에 대한 EKS 클러스터에 액세스 항목을 추가해야 합니다.
참고
대시보드에서 HyperPod EKS 클러스터 작업을 보려면
-
지정된 HyperPod 네임스페이스의 데이터 과학자 사용자가 Amazon EKS 오케스트레이션 클러스터에서 작업 실행을 승인하도록 Kubernetes 역할 기반 액세스 제어(RBAC)를 구성합니다. 네임스페이스는 형식을 따릅니다
hyperpod-ns-
. RBAC 권한을 설정하려면 팀 역할 생성 지침을team-name
참조하세요. -
작업이 적절한 네임스페이스 및 우선 순위 클래스 레이블과 함께 제출되었는지 확인합니다. 포괄적인 예는 섹션을 참조하세요SageMaker AI 관리형 대기열 및 네임스페이스에 작업 제출.
EKS 클러스터의 경우 kubeflow(PyTorch, MPI, TensorFlow) 작업이 표시됩니다. 기본적으로 PyTorch 작업이 표시됩니다. 드롭다운 메뉴를 선택하거나 검색 필드를 사용하여 PyTorch, MPI, TensorFlow 작업을 필터링할 수 있습니다. 각 작업에 대해 표시되는 정보에는 작업 이름, 상태, 네임스페이스, 우선순위 클래스 및 생성 시간이 포함됩니다.