SageMaker Note di rilascio della libreria di parallelismo dei dati AI - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

SageMaker Note di rilascio della libreria di parallelismo dei dati AI

Consulta le seguenti note di rilascio per tenere traccia degli ultimi aggiornamenti per la libreria SageMaker AI Distributed Data Parallelism (SMDDP).

La libreria di parallelismo dei SageMaker dati distribuiti AI v2.5.0

Data: 17 ottobre 2024

Nuove funzionalità

  • Aggiunto il supporto per la PyTorch v2.4.1 con CUDA v12.1.

Integrazione nei contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è migrata a. La libreria di SageMaker parallelismo dei modelli v2.6.0

658645717510.dkr.ecr.<us-west-2>.amazonaws.com/smdistributed-modelparallel:2.4.1-gpu-py311-cu121

Per le regioni in cui sono disponibili le immagini SMP Docker, vedi. Regioni AWS

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando il seguente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.4.1/cu121/2024-10-09/smdistributed_dataparallel-2.5.0-cp311-cp311-linux_x86_64.whl

La libreria di parallelismo dei dati distribuiti SageMaker AI v2.3.0

Data: 11 giugno 2024

Nuove funzionalità

  • Aggiunto il supporto per la PyTorch v2.3.0 con CUDA v12.1 e Python v3.11.

  • È stato aggiunto PyTorch il supporto per Lightning v2.2.5. Questo è integrato nel contenitore del framework SageMaker AI per la versione 2.3.0. PyTorch

  • È stata aggiunta la convalida del tipo di istanza durante l'importazione per impedire il caricamento della libreria SMDDP su tipi di istanze non supportati. Per un elenco dei tipi di istanza compatibili con la libreria SMDDP, vedere. Framework e tipi di Regioni AWS istanze supportati

Integrazione in SageMaker AI Framework Containers

Questa versione della libreria SMDDP viene migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.3.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.3.0-gpu-py311-cu121-ubuntu20.04-sagemaker

Per un elenco completo delle versioni della libreria SMDDP e dei contenitori predefiniti, vedere. Framework e tipi di Regioni AWS istanze supportati

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando il seguente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.3.0/cu121/2024-05-23/smdistributed_dataparallel-2.3.0-cp311-cp311-linux_x86_64.whl

Altre modifiche

  • La libreria SMDDP v2.2.0 è integrata nel contenitore del framework SageMaker AI per la versione 2.2.0. PyTorch

La SageMaker libreria di parallelismo dei dati distribuiti AI v2.2.0

Data: 4 marzo 2024

Nuove funzionalità

  • Aggiunto il supporto per la PyTorch v2.2.0 con CUDA v12.1.

Integrazione nei contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è migrata a. La libreria di parallelismo dei modelli v2.2.0 SageMaker

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.2.0-gpu-py310-cu121

Per le regioni in cui sono disponibili le immagini SMP Docker, vedi. Regioni AWS

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando il seguente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.2.0/cu121/2024-03-04/smdistributed_dataparallel-2.2.0-cp310-cp310-linux_x86_64.whl

La libreria di parallelismo dei dati distribuiti SageMaker AI v2.1.0

Data: 1 marzo 2024

Nuove funzionalità

  • Aggiunto il supporto per la PyTorch v2.1.0 con CUDA v12.1.

Correzioni di bug

  • Risolto il problema di perdita di memoria della CPU in. SMDDP v2.0.1

Integrazione in SageMaker AI Framework Containers

Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.1.0

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.1.0-gpu-py310-cu121-ubuntu20.04-sagemaker

Integrazione in contenitori Docker distribuiti dalla libreria SageMaker AI Model Parallelism (SMP)

Questa versione della libreria SMDDP è migrata a. La libreria di parallelismo dei modelli v2.1.0 SageMaker

658645717510.dkr.ecr.<region>.amazonaws.com/smdistributed-modelparallel:2.1.2-gpu-py310-cu121

Per le regioni in cui sono disponibili le immagini SMP Docker, vedi. Regioni AWS

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando il seguente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.1.0/cu121/2024-02-04/smdistributed_dataparallel-2.1.0-cp310-cp310-linux_x86_64.whl

La libreria di parallelismo dei dati distribuiti SageMaker AI v2.0.1

Data: 7 dicembre 2023

Nuove funzionalità

Problemi noti

  • Esiste un problema di perdita di memoria della CPU a causa di un aumento graduale della memoria della CPU durante l'allenamento con AllReduce SMDDP in modalità DDP.

Integrazione in AI Framework Containers SageMaker

Questa versione della libreria SMDDP ha superato i test di benchmark ed è stata migrata al seguente SageMaker AI Framework Container.

  • PyTorch v2.0.1

    763104351884.dkr.ecr.<region>.amazonaws.com/pytorch-training:2.0.1-gpu-py310-cu118-ubuntu20.04-sagemaker

File binario di questa versione

È possibile scaricare o installare la libreria utilizzando il seguente URL.

https://smdataparallel.s3.amazonaws.com/binary/pytorch/2.0.1/cu118/2023-12-07/smdistributed_dataparallel-2.0.2-cp310-cp310-linux_x86_64.whl

Altre modifiche