本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
檢視端點狀態
如果您想要使用訓練過的模型對即時資料執行推論,請將模型部署到即時端點。為了確保預測的適當延遲,您需要確保託管模型的執行個體有效率地執行。模型儀表板的端點監控特徵可顯示有關端點組態的即時資訊,並協助您透過指標追蹤端點效能。
監控設定
模型儀表板會連結至現有的 SageMaker AI 端點詳細資訊頁面,這些頁面會顯示您可以在 Amazon CloudWatch 中選擇的指標的即時圖表。在儀表板中,您可以在端點處理即時推論請求時追蹤這些指標。一些您可以選取的指標如下:
-
CpuUtilization
:每個個別 CPU 核心使用率的總和,每個核心的使用率介於 0% 至 100% 之間。 -
MemoryUtilization
:執行個體上的容器使用的記憶體的百分比,介於 0% 至 100% 之間。 -
DiskUtilization
:執行個體所用容器使用的磁碟空間百分比,介於 0% 至 100% 之間。。
如需可即時檢視指標的完整清單,請參閱使用 Amazon CloudWatch 監控 Amazon SageMaker AI 的指標 Amazon CloudWatch。
執行期設定
Amazon SageMaker AI 支援託管模型的自動擴展 (自動擴展)。自動擴展會動態調整針對模型佈建的執行個體數目,因應工作負載的變更。當工作負載增加時,自動擴展會讓更多的執行個體上線。當工作負載減少時,自動擴展會移除不必要的執行個體,讓您不需為了用不到的已佈建執行個體再支付費用。您可以在模型儀表板中自訂以下執行期設定:
-
更新權重:使用數值加權來變更指派給每個執行個體的工作負載量。如需在自動擴展期間執行個體加權的更多相關資訊,請參閱設定 Amazon EC2 Auto Scaling 的執行個體加權。
-
更新執行個體計數:變更可在工作負載增加時,工作負載提供服務的執行個體總數。
如需端點執行期設定的更多相關資訊,請參閱 CreateEndpointConfig。
端點組態設定
端點組態設定會顯示您在建立端點時指定的設定。這些設定會通知 SageMaker AI 為您的端點佈建哪些資源。部分設定包含在下列:
如需端點組態設定的更多相關資訊,請參閱 CreateEndpointConfig。
檢視一個端點的狀態和組態
若要檢視模型端點的狀態和組態,請完成下列步驟:
-
開啟 SageMaker AI 主控台
。 -
選擇在左側面板中的控管。
-
選擇模型儀表板。
-
在模型儀表板的模型區段中,選取要檢視之端點的模型名稱。
-
選取在端點區段中的端點名稱。