Exemplos da biblioteca de paralelismo de modelos do Amazon SageMaker v1
Esta página fornece uma lista de blogs e cadernos Jupyter que apresentam exemplos práticos da implementação da biblioteca de paralelismo de modelos do SageMaker (SMP) v1 para executar trabalhos de treinamento distribuídos no SageMaker.
Blogs e estudos de caso
Os blogs a seguir debatem estudos de caso sobre o uso do SMP v1.
-
Novas melhorias de performance na biblioteca de paralelismo de modelos do Amazon SageMaker
, Blog de Machine Learning AWS (16 de dezembro de 2022) -
Treine modelos gigantescos com escala quase linear usando paralelismo de dados fragmentados no Amazon SageMaker
, blog de Machine Learning AWS (31 de outubro de 2022)
Cadernos de exemplo
Esses cadernos de exemplos são fornecidos nos repositórios GitHub de exemplos do SageMakertraining/distributed_training/pytorch/model_parallel
:
nota
Clone e execute os cadernos de exemplo nos seguintes IDEs de ML do SageMaker:
-
SageMaker JupyterLab (disponível no Studio criado após dezembro de 2023)
-
Editor de Código SageMaker (disponível no Studio criado após dezembro de 2023)
-
Studio Classic (disponível como uma aplicação no Studio criado após dezembro de 2023)
git clone https://github.com/aws/amazon-sagemaker-examples.git cd amazon-sagemaker-examples/training/distributed_training/pytorch/model_parallel
Cadernos de exemplos do SMP v1 para PyTorch
Cadernos de exemplos do SMP v1 para TensorFlow