本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
透過 SageMaker 訓練的異質叢集功能,您可以使用多種類型的機器學習 (ML) 執行個體執行訓練任務,以便針對不同的機器學習 (ML) 訓練任務和目的提供更完善的資源擴展與使用率。例如,若在具有 GPU 執行個體的叢集上之訓練任務因 CPU 密集任務而遭受低 GPU 使用率和 CPU 瓶頸問題,則使用異質叢集可透過新增更具成本效益的 CPU 執行個體群組,來妥善卸載 CPU 密集型任務、解決此類瓶頸問題,並達到更佳的 GPU 使用率。
注意
此功能可在 SageMaker Python SDK v2.98.0 及較新版本中取得。
注意
此功能可透過 SageMaker AI PyTorch
另請參閱部落格 使用 Amazon SageMaker AI 異質叢集改善模型訓練的價格效能