Libreria di parallelismo dei SageMaker modelli (archiviata) v1.x - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Libreria di parallelismo dei SageMaker modelli (archiviata) v1.x

Importante

A partire dal 19 dicembre 2023, viene rilasciata la SageMaker model parallelism (SMP) library v2. A favore della SMP libreria v2, le funzionalità SMP v1 non sono più supportate nelle versioni future. La sezione e gli argomenti seguenti sono archiviati e riguardano specificamente l'uso della libreria v1. SMP Per informazioni sull'uso della SMP libreria v2, vedere. SageMaker libreria di parallelismo dei modelli v2

Usa la libreria parallela di modelli di Amazon SageMaker AI per addestrare modelli di deep learning (DL) di grandi dimensioni che sono difficili da addestrare a causa delle limitazioni di GPU memoria. La libreria suddivide automaticamente ed efficacemente un modello tra più GPUs istanze. Utilizzando la libreria, puoi raggiungere più rapidamente l'obiettivo di precisione di previsione addestrando in modo efficiente modelli DL più grandi con miliardi o trilioni di parametri.

È possibile utilizzare la libreria per partizionare automaticamente i propri PyTorch modelli su più TensorFlow e più nodi con modifiche GPUs minime al codice. Puoi accedere alla libreria API tramite SageMaker PythonSDK.

Utilizza le seguenti sezioni per saperne di più sul parallelismo dei modelli e sulla libreria di modelli SageMaker paralleli. La API documentazione di questa libreria si trova in Distributed Training APIs nella documentazione di SageMaker Python SDK v2.199.0.