本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
準備為Machine Learning建立 EKS 叢集
您可以透過多種方式增強 Machine Learning on EKS 體驗。本節的下列頁面將協助您:
-
了解您在 EKS 上使用 ML 和 的選擇
-
協助準備您的 EKS 和 ML 環境。
特別是,這將幫助您:
-
選擇 AMIs: AWS 提供多個自訂 AMIs,以便在 Word 上執行 ML 工作負載EKS。請參閱 使用 EKS 最佳化加速 Amazon Linux AMIs 建立節點。
-
自訂AMIs:您可以進一步修改 AWS 自訂AMIs,以新增特定使用案例所需的其他軟體和驅動程式。請參閱 使用 ML 的容量區塊建立自我管理節點。
-
Reserve GPUs:由於對 GPUs 的需求,為了確保在您需要時可以使用您需要的 GPUs,您可以提前保留您需要的 GPUs。請參閱 防止 Pods 在特定節點上排程。
-
新增EFA:新增彈性結構轉接器,以提高節點間叢集通訊的網路效能。請參閱 將 Elastic Fabric Adapter 新增至 EKS 叢集以進行 ML 訓練。
-
Use AWSInferentia 工作負載:使用 Amazon EKS Inf1 執行個體建立 EC2 叢集。請參閱將 AWS Inferentia 執行個體與Machine Learning的 EKS 叢集搭配使用。