기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
자습서: Amazon EKS 클러스터에서 GPU 작업 실행
GPU 리소스는 압축할 수 없습니다.는 요청 값이 제한 값과 동일한 GPU 작업에 대한 포드 사양을 AWS Batch 생성합니다. 이는 Kubernetes 요구 사항입니다.
작업을 다시 시작하려면 다음 명령을 실행합니다.
$
aws batch submit-job --job-queue My-Eks-GPU-JQ1 --job-definition MyGPUJobOnEks_Smi --job-name My-Eks-GPU-Job
# locate information that can help debug or find logs (if using Amazon CloudWatch Logs with Fluent Bit)
$
aws batch describe-jobs --job
<job-id>
| jq '.jobs[].eksProperties.podProperties | {podName, nodeName}'{ "podName": "aws-batch.f3d697c4-3bb5-3955-aa6c-977fcf1cb0ca", "nodeName": "ip-192-168-59-101.ec2.internal" }