本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
我们推荐的 GPU 实例适用于大多数深度学习目的。在 GPU 实例上训练新模型比在 CPU 实例上更快。当您拥有多 GPU 实例或在多个实例上使用分布式训练时,您可以进行亚线性扩展。 GPUs
以下实例类型支持 DLAMI。有关 GPU 实例类型选项及其用途的信息,请参阅实例类型
注意
应将模型大小作为选择实例的一个因素。如果模型超出了实例的可用 RAM,请为应用程序选择其它具有足够内存的实例类型。
-
亚马逊 EC2 P5e 实例
最多有 8 个 NVIDIA Tesla H200。 GPUs -
亚马逊 EC2 P5 实例
最多有 8 个 NVIDIA Tesla H GPUs 100。 -
亚马逊 EC2 P4 实例
最多有 8 个 NVIDIA Tesla A GPUs 100。 亚马逊 EC2 P3 实例
最多有 8 个 NVIDIA Tesla V GPUs 100。 -
亚马逊 EC2 G3 实例
最多有 4 个 NVIDIA Tesla M60 GPUs。 -
亚马逊 EC2 G4 实例
最多有 4 个 NVIDIA T GPUs 4。 -
亚马逊 EC2 G5 实例
最多有 8 个 NVIDIA A GPUs 10G。 -
亚马逊 EC2 G6 实例
最多有 8 个 NVIDIA L GPUs 4。 -
亚马逊 EC2 G6e 实例
最多有 8 个 NVIDIA L40S Tensor Core。 GPUs
DLAMI 实例提供了用于监控和优化 GPU 进程的工具。有关监控 GPU 进程的更多信息,请参阅 GPU 监控和优化。
有关使用 G5g 实例的特定教程,请参阅 ARM64 DLAMI。