本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在異質叢集上執行訓練任務
使用 SageMaker Training 的異質叢集功能,您可以使用多種類型的 ML 執行個體執行訓練任務,以針對不同的 ML 訓練任務和目的,提供更好的資源擴展和使用率。例如,如果您在具有GPU執行個體的叢集上的訓練任務因為CPU密集型任務而遭受低GPU使用率和CPU瓶頸問題,則使用異質叢集可以透過新增更具成本效益的CPU執行個體群組、解決此類瓶頸問題,並實現更好的GPU使用率,協助卸載CPU密集型任務。
注意
此功能可在 SageMaker Python v2.98SDK.0 及更新版本中使用。
注意
此功能可透過 SageMaker PyTorch
另請參閱部落格 使用 Amazon SageMaker 異質叢集改善模型訓練的價格效能。