本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker 資料平行程式庫範例
本頁提供 Jupyter 筆記本,其中提供實作 SageMaker分散式資料平行處理原則 (SMDDP) 程式庫以執行分散式訓練工作的範例。 SageMaker
部落格與案例研究
以下部落格討論有關使用 SMDDP 程式庫的案例研究。
貼片共享計劃 V2 部落格
SMDDP 第 1 版部落格
-
我如何訓練 10TB 以獲得中等穩定擴散
(2022 年 11 月 29 日) SageMaker -
在 Amazon 上運行 PyTorch 閃電和本地 PyTorch DDP SageMaker 培訓,包括 Machine L AWS earning 博客 Amazon 搜索
(2022 年 8 月 18 日) -
AWS 使用 PyTorch 和 SageMaker 分佈式數據 parallel 庫中培訓 Yolov5
(2022 年 5 月 6 日) -
SageMaker 使用 PyTorch 和 SageMaker 分散式資料 parallel 程式庫中加速 EfficientNet 模型訓練
(2022 年 3 月 21 日) -
利AWS 用 SageMaker 分散式資料 parallel 程式庫「邁向資料科學」加速 EfficientNet 訓練
(2022 年 1 月 12 日) -
現代汽車使用 Amazon SageMaker Machine L earning 部落格縮短自動駕駛模型的AWS 機器學習模型訓練時間
(2021 年 6 月 25 日) -
分佈式培訓:使用變形金剛和 Amazon SageMaker,Hugging Face 網站(2021 年 4 月 8 日)訓練 BART/T5 進行總結
範例筆記本
範例記事本會在範SageMaker 例 GitHub 儲存庫training/distributed_training/pytorch/data_parallel
。
注意
複製並執行下列 SageMaker ML IDE 中的範例筆記本。
-
SageMaker JupyterLab(於 2023 年 12 月之後創建的工作室提供)
git clone https://github.com/aws/amazon-sagemaker-examples.git cd amazon-sagemaker-examples/training/distributed_training/pytorch/data_parallel
SMDDP 第 2 版範例
SMDDP 第 1 版範例