SageMaker notas de publicación de la biblioteca de paralelismo de datos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker notas de publicación de la biblioteca de paralelismo de datos

Consulte las siguientes notas de la versión para realizar un seguimiento de las actualizaciones más recientes de la biblioteca de paralelismo de datos SageMaker distribuido (SMDDP).

La SageMaker biblioteca de paralelismo de datos distribuidos, versión 2.3.0

Fecha: 11 de junio de 2024

Nuevas características

  • Se agregó soporte para PyTorch v2.3.0 con CUDA v12.1 y Python v3.11.

  • Se agregó soporte para Lightning PyTorch v2.2.5. Está integrado en el contenedor del SageMaker framework de la versión 2.3.0. PyTorch

  • Se agregó la validación del tipo de instancia durante la importación para evitar que se cargue la biblioteca SMDDP en tipos de instancia no compatibles. Para obtener una lista de los tipos de instancias compatibles con la biblioteca SMDDP, consulta. Marcos y tipos Regiones de AWS de instancias compatibles

Integración en Framework Containers SageMaker

Esta versión de la biblioteca SMDDP se migra al siguiente contenedor de SageMaker Framework.

  • PyTorch v2.3.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker

Para obtener una lista completa de las versiones de la biblioteca SMDDP y los contenedores prediseñados, consulte. Marcos y tipos Regiones de AWS de instancias compatibles

Archivo binario de esta versión

Puede descargar o instalar la biblioteca mediante la siguiente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl

Otros cambios

  • La biblioteca SMDDP v2.2.0 está integrada en el contenedor de SageMaker marcos de la versión 2.2.0. PyTorch

La biblioteca de paralelismo de datos distribuidos v2.2.0 SageMaker

Fecha: 4 de marzo de 2024

Nuevas características

  • Se agregó soporte para la PyTorch versión 2.2.0 con la versión 12.1 de CUDA.

Integración en contenedores Docker distribuidos por la biblioteca de paralelismo de modelos (SMP SageMaker )

Esta versión de la biblioteca SMDDP se migra a. La biblioteca de SageMaker modelos de paralelismo v2.2.0

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121

Para ver las regiones en las que están disponibles las imágenes de Docker de SMP, consulte. Regiones de AWS

Archivo binario de esta versión

Puede descargar o instalar la biblioteca mediante la siguiente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl

La biblioteca de paralelismo de datos SageMaker distribuidos, versión 2.1.0

Fecha: 1 de marzo de 2024

Nuevas características

  • Se agregó soporte para la PyTorch versión 2.1.0 con la versión 12.1 de CUDA.

Correcciones de errores

  • Se corrigió el problema de pérdida de memoria de la CPU en. SMDDP v2.0.1

Integración en SageMaker Framework Containers

Esta versión de la biblioteca SMDDP ha superado las pruebas comparativas y se migró al siguiente contenedor de SageMaker Framework.

  • PyTorch v2.1.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker

Integración en contenedores Docker distribuidos por la biblioteca de paralelismo de SageMaker modelos (SMP)

Esta versión de la biblioteca SMDDP se migra a. La biblioteca de SageMaker modelos de paralelismo v2.1.0

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121

Para ver las regiones en las que están disponibles las imágenes de Docker de SMP, consulte. Regiones de AWS

Archivo binario de esta versión

Puede descargar o instalar la biblioteca mediante la siguiente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl

La biblioteca de paralelismo de datos SageMaker distribuidos v2.0.1

Fecha: 7 de diciembre de 2023

Nuevas características

Problemas conocidos

  • Hay un problema de pérdida de memoria de la CPU debido a un aumento gradual de la memoria de la CPU durante el entrenamiento con SMDDP en modo DDPAllReduce.

Integración en Framework Containers SageMaker

Esta versión de la biblioteca SMDDP ha superado las pruebas comparativas y se migró al siguiente contenedor de SageMaker Framework.

  • PyTorch v2.0.1

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker

Archivo binario de esta versión

Puede descargar o instalar la biblioteca mediante la siguiente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl

Otros cambios

  • A partir de esta versión, la documentación de la biblioteca SMDDP está totalmente disponible en esta guía para SageMaker desarrolladores de Amazon. En favor de la guía completa para desarrolladores de SMDDP v2 incluida en la Guía para SageMaker desarrolladores de Amazon, ya no se admite la documentación para la referencia adicional de SMDDP v1.x en la documentación del SDK de SageMaker Python. Si aún necesita la documentación de SMP v1.x, consulte la siguiente instantánea de la documentación en la documentación del SDK de SageMaker Python v2.212.0.