教程:在您的 Amazon EKS 集群中运行GPU作业 - AWS Batch

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

教程:在您的 Amazon EKS 集群中运行GPU作业

GPU资源不可压缩。 AWS Batch 为请求值等于限制值的GPU任务创建 pod 规范。这是一个 Kubernetes 要求。

要提交作GPU业,请运行以下命令。

$ aws batch submit-job --job-queue My-Eks-GPU-JQ1 --job-definition MyGPUJobOnEks_Smi --job-name My-Eks-GPU-Job # locate information that can help debug or find logs (if using Amazon CloudWatch Logs with Fluent Bit) $ aws batch describe-jobs --job <job-id> | jq '.jobs[].eksProperties.podProperties | {podName, nodeName}' { "podName": "aws-batch.f3d697c4-3bb5-3955-aa6c-977fcf1cb0ca", "nodeName": "ip-192-168-59-101.ec2.internal" }