Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker IA - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entrenamiento distribuido con la biblioteca de paralelismo de datos distribuidos de SageMaker IA

La biblioteca de paralelismo de datos distribuido (SMDDP) de SageMaker IA está diseñada para facilitar su uso y ofrecer una integración perfecta con ella. PyTorch

Cuando entrenes un modelo de aprendizaje profundo con la biblioteca SMDDP sobre SageMaker IA, puedes centrarte en escribir el guion de entrenamiento y el modelo de entrenamiento.

Para empezar, importe la biblioteca de SMDDP para utilizar sus operaciones colectivas optimizadas para AWS. En los temas siguientes se proporcionan instrucciones sobre qué añadir al script de entrenamiento en función de la operación colectiva que desee optimizar.