本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
SageMaker HyperPod 任務控管是一種強大的管理系統,旨在簡化資源配置,並確保 Amazon EKS 叢集跨團隊和專案的運算資源有效利用。這為管理員提供了設定 的功能:
-
各種任務的優先順序層級
-
每個團隊的運算配置
-
每個團隊如何借出閒置運算
-
如果團隊先佔自己的任務
HyperPod 任務控管也提供 Amazon EKS 叢集可觀測性,提供叢集容量的即時可見性。這包括運算可用性和用量、團隊配置和使用率,以及任務執行和等待時間資訊,讓您為明智的決策和主動資源管理做好準備。
下列各節說明如何設定、了解關鍵概念,以及為您的 Amazon EKS 叢集使用 HyperPod 任務控管。