使用 SageMaker AI 一般估算器來擴展預先建置的DLC容器 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 SageMaker AI 一般估算器來擴展預先建置的DLC容器

您可以自訂 SageMaker AI 預先建置的容器,或將其擴展,以處理預先建置 SageMaker AI Docker 映像不支援之演算法或模型的任何其他功能需求。有關如何擴展預構建容器的範例,請參閱擴展預構建的容器

若要擴充預先建置的容器或調整您自己的容器以使用程式庫,您必須使用 支援的架構 中列出的其中一個映像。

注意

從 TensorFlow 2.4.1 和 PyTorch 1.8.1, SageMaker AI 架構DLCs支援啟用 EFA的執行個體類型。我們建議您使用包含 TensorFlow 2.4.1 或更新版本和 PyTorch 1.8.1 或更新版本的DLC映像。

例如,如果您使用 PyTorch,您的 Dockerfile 應包含類似下列的FROM陳述式:

# SageMaker AI PyTorch image FROM 763104351884.dkr.ecr.<aws-region>.amazonaws.com/pytorch-training:<image-tag> ENV PATH="/opt/ml/code:${PATH}" # this environment variable is used by the SageMaker AI PyTorch container to determine our user code directory. ENV SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/code # /opt/ml and all subdirectories are utilized by SageMaker AI, use the /code subdirectory to store your user code. COPY train.py /opt/ml/code/train.py # Defines cifar10.py as script entrypoint ENV SAGEMAKER_PROGRAM train.py

您可以使用SageMaker 訓練工具組和 SageMaker AI 分散式資料平行程式庫的二進位檔案,進一步自訂自己的 Docker 容器來使用 SageMaker AI。如需進一步了解,請參閱下一節中的指示。