擷取 SageMaker HyperPod 叢集詳細資訊 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

擷取 SageMaker HyperPod 叢集詳細資訊

了解如何使用 擷取 SageMaker HyperPod 叢集詳細資訊 AWS CLI。

描述叢集

執行 describe-cluster 以檢查叢集的狀態。您可以指定叢集的名稱或 ARN 。

aws sagemaker describe-cluster --cluster-name your-hyperpod-cluster

叢集的狀態變為 後InService,繼續下一個步驟。使用此 API,您也可以從執行其他 HyperPod API操作中擷取失敗訊息。

列出叢集節點的詳細資訊

執行 list-cluster-nodes 以檢查叢集節點的金鑰資訊。

aws sagemaker list-cluster-nodes --cluster-name your-hyperpod-cluster

這會傳回回應,而 InstanceId是記錄 (使用 aws ssm) 至回應時需要使用的 。

描述叢集節點的詳細資訊

執行 describe-cluster-node 以擷取叢集節點的詳細資訊。您可以從輸出取得叢集節點 ID list-cluster-nodes。您可以指定叢集的名稱或 ARN 。

aws sagemaker describe-cluster-node \ --cluster-name your-hyperpod-cluster \ --node-id i-111222333444555aa

列出叢集

執行 list-cluster 以列出您帳戶中的所有叢集。

aws sagemaker list-clusters

您也可以新增其他旗標,以篩選向下的叢集清單。若要進一步了解此命令在低層級執行的作業,以及其他用於篩選的旗標,請參閱 ListClustersAPI參考。