本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
端點監控
建立 SageMaker AI Hosting 端點後,您可以使用 Amazon CloudWatch 監控端點,這會收集原始資料並將其處理為可讀且近乎即時的指標。使用這些指標,您可以存取歷史資訊,並更加了解端點的執行狀況。如需更多資訊,請參閱 Amazon CloudWatch 使用者指南。
您可以從端點詳細資訊頁面的監控索引標籤,檢視從端點收集的 CloudWatch 指標資料。
監控索引標籤包含下列區段:
-
操作指標:查看用於追蹤端點資源使用率的指標,例如 CPU 利用率和記憶體使用率。
-
調用指標:檢視追蹤傳送到端點的
InvokeEndpoint
請求數量、運作狀態和狀態的指標,例如調用模型錯誤和模型延遲。 -
運作狀態指標:檢視追蹤端點整體運作狀態的指標,例如調用失敗和通知失敗。
如需每個指標的詳細說明,請參閱使用 CloudWatch 監控 SageMaker AI。
下列螢幕擷取畫面顯示無伺服器端點的操作指標區段。

您可以針對指定區段中的指標調整要追蹤的期間和統計資料,以及要檢視指標資料的時間長度。您也可以選擇新增小工具,在每個區段的檢視中新增和移除指標小工具。在新增小工具對話方塊中,您可以選取並取消選取要查看的指標。
可用的指標可能取決於您的端點類型。例如,無伺服器端點具有一些無法用於即時端點的指標。如需端點類型的特定指標資訊,請參閱以下頁面: