本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
in AWS PCS 概念
叢集 in AWS PCS 有 1 個以上的佇列,與至少 1 個運算節點群組相關聯。任務會提交至佇列,並在運算節點群組定義的 EC2 執行個體上執行。您可以使用這些基礎來實作複雜的 HPC 架構。
叢集
叢集是管理資源和執行工作負載的資源。叢集是 AWS PCS 資源,定義運算、聯網、儲存、身分和任務排程器組態的組合。您可以透過指定要使用的任務排程器 (目前為 Slurm)、您想要的排程器組態、您想要管理叢集的服務控制器,以及您想要啟動叢集資源的 VPC 來建立叢集。排程器接受並排程任務,也會啟動處理這些任務的運算節點 (EC2 執行個體)。
運算節點群組
運算節點群組是一組運算節點, AWS PCS 用來執行任務或提供叢集的互動式存取權。定義運算節點群組時,您可以指定常見特徵,例如 Amazon EC2 執行個體類型、執行個體數量下限和上限、目標 VPC 子網路、Amazon Machine Image (AMI)、購買選項和自訂啟動組態。 AWS PCS 使用這些設定來有效啟動、管理和終止運算節點群組中的運算節點。
佇列
當您想要在特定叢集上執行任務時,您可以將其提交至特定佇列 (有時也稱為分割區)。任務會保留在佇列中,直到 AWS PCS 排程在運算節點群組上執行。您可以將一或多個運算節點群組與每個佇列建立關聯。使用任務排程器提供的各種排程政策,在基礎運算節點群組資源上排程和執行任務需要佇列。使用者不會將任務直接提交至運算節點或運算節點群組。
系統管理員
系統管理員部署、維護和操作叢集。他們可以透過 AWS Management Console、 AWS PCS Word API和Word AWS PCS 存取 AWS SDK。他們可以透過 SSH 或 存取特定叢集 AWS Systems Manager,在其中執行管理任務、執行任務、管理資料,以及執行其他 Shell 型活動。如需詳細資訊,請參閱 AWS Systems Manager 文件。
最終使用者
最終使用者沒有部署或操作叢集的 day-to-day 責任。他們使用終端機界面 (例如 SSH) 來存取叢集資源、執行任務、管理資料,以及執行其他 Shell 型活動。