本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
檢視訓練計畫詳細資訊
若要監控訓練計劃的狀態或擷取詳細資訊,您可以使用 DescribeTrainingPlan
API。API 回應包含 Status
欄位,反映訓練計畫的目前狀態:
-
如果計劃購買失敗,狀態會設為
Failed
。 -
成功付款後,狀態會根據計劃的開始日期
Scheduled
從 轉換為Pending
。 -
當計劃到達其開始日期時,狀態會變更為
Active
。 -
對於具有多個不連續預留容量的計劃,狀態會在
Scheduled
作用中期間之間還原為 ,直到下一個預留容量的開始日期為止。 -
在計劃的結束日期之後,狀態會變成
Expired
。
狀態為 後Scheduled
,您就可以為 SageMaker 訓練任務或 HyperPod 叢集工作負載利用計劃中預留的容量。
注意
-
與計劃相關聯的訓練任務會保持
Pending
狀態,直到計劃變成 為止Active
。 -
對於使用運算容量訓練計畫的 HyperPod 叢集,執行個體群組狀態會顯示為
InService
已建立。
下列範例使用 AWS CLI 命令,依名稱擷取訓練計劃的詳細資訊。
aws sagemaker describe-training-plan \ --training-plan-name "
name
"
此 JSON 文件是來自 SageMaker 訓練計畫 API 的範例回應。此回應提供已成功建立之訓練計畫的詳細資訊。
{ "AvailableInstanceCount": 2, "CurrencyCode": "USD", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InUseInstanceCount": 2, "ReservedCapacitySummaries": [ { "AvailabilityZone": "string", "DurationHours": 48, "DurationMinutes": 0, "EndTime": "2024-09-28T04:30:00-07:00", "InstanceType": "ml.p5.48xlarge", "ReservedCapacityArn": "arn:aws:sagemaker:us-east-1:123456789123:reserved-capacity/large-models-fine-tuning-rc1", "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "TotalInstanceCount": 4 } ], "StartTime": "2024-09-26T04:30:00-07:00", "Status": "Scheduled", "StatusMessage": "Payment confirmed, training plan scheduled." "TargetResources": [ "training-job" ], "TotalInstanceCount": 4, "TrainingPlanArn": "arn:aws:sagemaker:us-east-1:123456789123:training-plan/large-models-fine-tuning", "TrainingPlanName": "large-models-fine-tuning", "UpfrontFee": "xxxx.xx" }
下列各節定義 DescribeTrainingPlan
API 操作的強制輸入請求參數。
必要參數
-
TrainingPlanName
:您要描述的訓練計畫名稱。