教學課程:在 Amazon EKS 叢集中執行 GPU 任務 - AWS Batch


教學課程:在 Amazon EKS 叢集中執行 GPU 任務

GPU 資源不可壓縮。 會為 GPU 任務 AWS Batch 建立 Pod 規格,其中請求的值等於限制的值。這是Kubernetes要求。

若要提交 GPU 任務,請執行下列命令。

$ aws batch submit-job --job-queue My-Eks-GPU-JQ1 --job-definition MyGPUJobOnEks_Smi --job-name My-Eks-GPU-Job # locate information that can help debug or find logs (if using Amazon CloudWatch Logs with Fluent Bit) $ aws batch describe-jobs --job <job-id> | jq '.jobs[].eksProperties.podProperties | {podName, nodeName}' { "podName": "aws-batch.f3d697c4-3bb5-3955-aa6c-977fcf1cb0ca", "nodeName": "ip-192-168-59-101.ec2.internal" }