Scopri di più sulla SageMaker Model Parallelism Library v2 - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Scopri di più sulla SageMaker Model Parallelism Library v2

Nota

Dal rilascio della libreria SageMaker model parallelism (SMP) v2.0.0 il 19 dicembre 2023, questa documentazione è stata rinnovata per la libreria v2. SMP Per le versioni precedenti della libreria, vedere. SMP Libreria di parallelismo dei SageMaker modelli (archiviata) v1.x

La libreria di parallelismo dei SageMaker modelli Amazon è una funzionalità SageMaker che consente un training ottimizzato su larga scala ad alte prestazioni e su larga scala su istanze di calcolo SageMaker accelerate. Caratteristiche principali della libreria di parallelismo dei SageMaker modelli v2Includono tecniche e ottimizzazioni per accelerare e semplificare l'addestramento di modelli di grandi dimensioni, come il parallelismo ibrido dei dati condivisi, il parallelismo tensoriale, il checkpoint di attivazione e l'offload di attivazione. È possibile utilizzare la SMP libreria per accelerare l'addestramento e la messa a punto di modelli linguistici di grandi dimensioni (), modelli di visione di grandi dimensioni (LLMs) e modelli di base () con centinaia di miliardi di parametri. LVMs FMs

La libreria di parallelismo dei SageMaker modelli v2 (SMPv2) allinea la libreria APIs e i metodi con PyTorch Fully Sharded Data Parallelism (FSDP) open source, che offre il vantaggio di ottimizzazioni delle prestazioni con modifiche minime al codice. SMP Con la SMP v2, puoi migliorare le prestazioni computazionali dell'addestramento di un modello di grandi dimensioni integrando i tuoi script di addestramento in. state-of-the-art SageMaker PyTorch FSDP SageMaker

È possibile utilizzare SMP v2 per i lavori di SageMaker formazione generali e i carichi di lavoro di formazione distribuiti sui cluster. Amazon SageMaker HyperPod