As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Principais características da biblioteca de paralelismo de SageMaker modelos v2
A biblioteca de paralelismo de SageMaker modelos v2 (SMPv2) da Amazon oferece estratégias de distribuição e técnicas de economia de memória, como paralelismo de dados fragmentados, paralelismo de tensores e pontos de verificação. As estratégias e técnicas de paralelismo de modelos oferecidas pela SMP v2 ajudam a distribuir modelos grandes em vários dispositivos, otimizando a velocidade de treinamento e o consumo de memória. SMPA v2 também fornece um torch.sagemaker
pacote Python para ajudar a adaptar seu script de treinamento com algumas linhas de alteração de código.
Este guia segue o fluxo básico de duas etapas apresentado emUse a biblioteca de paralelismo de SageMaker modelos v2. Para se aprofundar nos principais recursos da SMP v2 e como usá-los, consulte os tópicos a seguir.
nota
Esses recursos principais estão disponíveis na SMP v2.0.0 e posterior e no SageMaker Python SDK v2.200.0 e posterior, e funcionam para a v2.0.1 e versões posteriores. PyTorch Para verificar as versões dos pacotes, consulteEstruturas compatíveis e Regiões da AWS.
Tópicos
- Paralelismo híbrido de dados fragmentados
- Paralelismo especializado
- Paralelismo de contexto
- Compatibilidade com a SMDDP biblioteca otimizada para AWS infraestrutura
- Treinamento misto de precisão
- Inicialização atrasada de parâmetros
- Ponto de verificação de ativação
- Ativação e descarregamento
- Paralelismo de tensores
- Ajuste fino
- FlashAttention
- Ponto de verificação usando SMP