在 EKS 上開始部署Machine Learning工具 - Amazon EKS

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 EKS 上開始部署Machine Learning工具

若要跳入 Machine Learning on EKS,請先從這些規範模式中選擇,以快速取得 EKS 叢集和 ML 軟體和硬體,以便開始執行 ML 工作負載。這些模式大部分都以 Amazon EKS 網站上的資料提供的 Terraform 藍圖為基礎。在開始之前,請注意以下幾點:

  • 執行這些程序需要 GPUs 或 Neuron 執行個體。缺乏這些資源可能會導致這些程序在叢集建立或節點自動擴展期間失敗。

  • Neuron SDK (Tranium 和 Inferentia 型執行個體) 可以節省成本,而且比 NVIDIA 更可用GPUs。因此,當您的工作負載允許時,建議您考慮將 Neutron 用於Machine Learning工作負載 (請參閱歡迎使用 AWS Neuron)。

  • 這裡的一些入門體驗要求您透過自己的 Hugging Face 帳戶取得資料。

若要開始,請從下列模式中選擇,這些模式旨在協助您開始設定基礎設施以執行Machine Learning工作負載:

繼續使用 ML on EKS

除了選擇本頁所述的藍圖之外,您還可以選擇其他方式,繼續執行 ML on EKS 文件。例如,您可以:

若要改善使用 ML on EKS 的工作,請參閱以下內容: