本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon SageMaker 模型并行度库 v1 示例
本页提供了博客和 Jupyter 笔记本的列表,这些博客和 Jupyter 笔记本提供了实现 SageMaker 模型并行度 (SMP) 库 v1 以运行分布式训练作业的实际示例。 SageMaker
博客和案例研究
以下博客讨论了有关使用 SMP v1 的案例研究。
-
亚马逊 SageMaker 模型并行度库的新性能改进,Machine Lear
n AWS ing 博客(202 2 年 12 月 16 日) -
在 Amazon 上使用分片数据并行度训练具有近线性扩展能力的巨型模型,Machine Learning Bl
og( SageMaker2022 AWS 年 10 月 31 日)
示例笔记本
示例 GitHub 存储库中提供了SageMaker 示例training/distributed_training/pytorch/model_parallel
。
注意
在以下 SageMaker ML IDE 中克隆并运行示例笔记本。
-
SageMaker JupyterLab(在 2023 年 12 月之后创建的工作室中可用)
-
SageMaker 代码编辑器(在 2023 年 12 月之后创建的 Studio 中可用)
-
Studio Classic(作为应用程序在 2023 年 12 月之后创建的 Studio 中
git clone https://github.com/aws/amazon-sagemaker-examples.git cd amazon-sagemaker-examples/training/distributed_training/pytorch/model_parallel
适用于 SMP v1 的示例笔记本电脑 PyTorch
适用于 SMP v1 的示例笔记本电脑 TensorFlow