使用 SageMaker 通用估算器扩展预建容器 DLC - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SageMaker 通用估算器扩展预建容器 DLC

您可以自定义 SageMaker 预构建的容器或对其进行扩展,以满足预构建 SageMaker Docker 镜像不支持的算法或模型的任何其他功能要求。有关如何扩展预构建容器的示例,请参阅扩展预构建容器

要扩展预构建的容器或调整您自己的容器以使用该库,您必须使用支持的框架中列出的映像之一。

注意

从 TensorFlow 2.4.1 和 PyTorch 1.8.1 开始, SageMaker 框架DLCs支持EFA启用的实例类型。我们建议您使用包含 TensorFlow 2.4.1 或更高版本以及 PyTorch 1.8.1 或更高版本的DLC图像。

例如,如果您使用 PyTorch,则您的 Dockerfile 应包含类似于以下内容的FROM语句:

# SageMaker PyTorch image FROM 763104351884.dkr.ecr.<aws-region>.amazonaws.com/pytorch-training:<image-tag> ENV PATH="/opt/ml/code:${PATH}" # this environment variable is used by the SageMaker PyTorch container to determine our user code directory. ENV SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/code # /opt/ml and all subdirectories are utilized by SageMaker, use the /code subdirectory to store your user code. COPY train.py /opt/ml/code/train.py # Defines cifar10.py as script entrypoint ENV SAGEMAKER_PROGRAM train.py

您可以使用SageMaker 训练工具包和 SageMaker 分布式数据并行库的二进制文件进一步自定义自己的 Docker 容器以供 SageMaker 使用。要了解更多信息,请参阅以下部分中的说明。