選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

SageMaker 模型平行處理程式庫的核心功能

焦點模式
SageMaker 模型平行處理程式庫的核心功能 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon SageMaker AI 的模型平行處理程式庫提供分佈策略和記憶體節省技術,例如碎片資料平行處理、張量平行處理、管道排程的逐層模型分割,以及檢查點。模型平行處理策略與技術有助於發佈大型模型到多個裝置,同時最佳化訓練速度及記憶體使用量。此程式庫也提供 Python 協助程式函式、內容管理員與包裝函式,以調整訓練指令碼來自動化或手動分割模型。

當您實作模型平行處理至訓練任務時,您會保持相同的兩個步驟工作流程,如同利用模型平行處理執行 SageMaker 分散式訓練任務區段所示。若要調整訓練指令碼,您需要新增零或幾行其他程式碼至訓練指令碼。若要啟動已調整訓練指令碼的訓練任務,您需要設定發佈設定參數,以便啟用節省記憶體功能,或傳遞平行處理程度的值。

若要開始使用範例,請參閱下列 Jupyter 筆記本,其中示範如何使用 SageMaker 模型平行處理程式庫。

若要深入了解程式庫的核心功能,請參閱下列主題。

注意

SageMaker 分散式訓練程式庫可透過 SageMaker Training 平台中 PyTorch、Hugging Face 和 TensorFlow 的 AWS 深度學習容器取得。若要利用分散式訓練程式庫的功能,建議您使用 SageMaker Python SDK。如果您透過適用於 Python 的 SDK (Boto3) 或 AWS Command Line Interface使用 SageMaker API,您還可以手動設定 JSON 的請求語法。在整份文件,指示與範例著重於如何搭配 SageMaker Python SDK 使用分散式訓練程式庫。

重要

SageMaker 模型平行處理程式庫支援 PyTorch 的所有核心功能,並支援 TensorFlow 的管道平行處理。

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。