En savoir plus sur la SageMaker bibliothèque de parallélisme de modèles v2 - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

En savoir plus sur la SageMaker bibliothèque de parallélisme de modèles v2

Note

Depuis la sortie de la bibliothèque SageMaker model parallelism (SMP) v2.0.0 le 19 décembre 2023, cette documentation est renouvelée pour la bibliothèque v2. SMP Pour les versions précédentes de la SMP bibliothèque, voir(Archivé) bibliothèque de parallélisme de SageMaker modèles v1.x.

La bibliothèque de parallélisme des SageMaker modèles Amazon est une fonctionnalité SageMaker qui permet de hautes performances et un entraînement optimisé à grande échelle sur des instances de calcul SageMaker accélérées. Elles Principales fonctionnalités de la bibliothèque de parallélisme de SageMaker modèles v2 incluent des techniques et des optimisations visant à accélérer et à simplifier l'apprentissage de grands modèles, telles que le parallélisme hybride de données fragmentées, le parallélisme des tenseurs, le point de contrôle d'activation et le déchargement des activations. Vous pouvez utiliser la SMP bibliothèque pour accélérer la formation et le réglage précis de grands modèles de langage (LLMs), de grands modèles de vision (LVMs) et de modèles de base (FMs) avec des centaines de milliards de paramètres.

La bibliothèque de parallélisme des SageMaker modèles v2 (SMPv2) aligne la bibliothèque APIs et les méthodes sur le parallélisme de données PyTorch entièrement partitionné (FSDP) open source, ce qui vous permet d'optimiser les SMP performances avec un minimum de modifications de code. Avec la SMP version 2, vous pouvez améliorer les performances informatiques liées à l'entraînement d'un modèle de state-of-the-art grande taille en SageMaker transférant vos scripts PyTorch FSDP d'entraînement vers SageMaker.

Vous pouvez utiliser la SMP version 2 pour les tâches de SageMaker formation générales et les charges de travail de formation distribuées sur les Amazon SageMaker HyperPod clusters.