Verwenden Sie den SageMaker generischen Estimator, um vorgefertigte DLC Container zu erweitern - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden Sie den SageMaker generischen Estimator, um vorgefertigte DLC Container zu erweitern

Sie können SageMaker vorgefertigte Container anpassen oder erweitern, um zusätzliche funktionale Anforderungen für Ihren Algorithmus oder Ihr Modell zu erfüllen, die das vorgefertigte SageMaker Docker-Image nicht unterstützt. Ein Beispiel dafür, wie Sie einen vorgefertigten Container erweitern können, finden Sie unter Erweitern eines vorgefertigten Containers.

Um einen vorgefertigten Container zu erweitern oder Ihren eigenen Container an die Verwendung der Bibliothek anzupassen, müssen Sie eines der unter Unterstützte Frameworks aufgeführten Bilder verwenden.

Anmerkung

Ab TensorFlow 2.4.1 und PyTorch 1.8.1 unterstützt das SageMaker Framework DLCs -fähige Instanztypen. EFA Wir empfehlen, dass Sie die DLC Images verwenden, die TensorFlow 2.4.1 oder höher und PyTorch 1.8.1 oder höher enthalten.

Wenn Sie beispielsweise verwenden PyTorch, sollte Ihr Dockerfile eine FROM Anweisung enthalten, die der folgenden ähnelt:

# SageMaker PyTorch image FROM 763104351884.dkr.ecr.<aws-region>.amazonaws.com/pytorch-training:<image-tag> ENV PATH="/opt/ml/code:${PATH}" # this environment variable is used by the SageMaker PyTorch container to determine our user code directory. ENV SAGEMAKER_SUBMIT_DIRECTORY /opt/ml/code # /opt/ml and all subdirectories are utilized by SageMaker, use the /code subdirectory to store your user code. COPY train.py /opt/ml/code/train.py # Defines cifar10.py as script entrypoint ENV SAGEMAKER_PROGRAM train.py

Sie können Ihren eigenen Docker-Container weiter an die Arbeit anpassen, SageMaker indem Sie das SageMaker Training Toolkit und die Binärdatei der SageMaker Distributed Data Parallel Library verwenden. Weitere Informationen hierzu finden Sie in den Anweisungen im folgenden Abschnitt.