檢視端點狀態

如果您想要使用訓練過的模型對即時資料執行推論，請將模型部署到即時端點。為了確保預測的適當延遲，您需要確保託管模型的執行個體有效率地執行。模型儀表板的端點監控特徵可顯示有關端點組態的即時資訊，並協助您透過指標追蹤端點效能。

監控設定

模型儀表板會連結至現有的 SageMaker AI 端點詳細資訊頁面，這些頁面會顯示您可以在 Amazon CloudWatch 中選擇的指標的即時圖表。在儀表板中，您可以在端點處理即時推論請求時追蹤這些指標。一些您可以選取的指標如下：

CpuUtilization：每個個別 CPU 核心使用率的總和，每個核心的使用率介於 0% 至 100% 之間。
MemoryUtilization：執行個體上的容器使用的記憶體的百分比，介於 0% 至 100% 之間。
DiskUtilization：執行個體所用容器使用的磁碟空間百分比，介於 0% 至 100% 之間。。

如需可即時檢視指標的完整清單，請參閱使用 Amazon CloudWatch 監控 Amazon SageMaker AI 的指標 Amazon CloudWatch。

執行期設定

Amazon SageMaker AI 支援託管模型的自動擴展（自動擴展）。自動擴展會動態調整針對模型佈建的執行個體數目，因應工作負載的變更。當工作負載增加時，自動擴展會讓更多的執行個體上線。當工作負載減少時，自動擴展會移除不必要的執行個體，讓您不需為了用不到的已佈建執行個體再支付費用。您可以在模型儀表板中自訂以下執行期設定：

更新權重：使用數值加權來變更指派給每個執行個體的工作負載量。如需在自動擴展期間執行個體加權的更多相關資訊，請參閱設定 Amazon EC2 Auto Scaling 的執行個體加權。
更新執行個體計數：變更可在工作負載增加時，工作負載提供服務的執行個體總數。

如需端點執行期設定的更多相關資訊，請參閱 CreateEndpointConfig。

端點組態設定

端點組態設定會顯示您在建立端點時指定的設定。這些設定會通知 SageMaker AI 為您的端點佈建哪些資源。部分設定包含在下列：

資料擷取：您可以選擇擷取有關端點輸入和輸出的資訊。例如，您可能想取樣傳入流量，以查看結果是否與訓練資料相關。您可以自訂取樣頻率、儲存資料的格式，以及儲存資料的 Amazon S3 位置。如需設定資料擷取組態的更多相關資訊，請參閱資料擷取。
生產變體：請參閱執行期設定中的先前討論。
非同步調用組態：如果您的端點是非同步的，本節包含 SageMaker AI 用戶端傳送至模型容器的並行請求數量上限、成功和失敗通知的 Amazon S3 位置，以及端點輸出的輸出位置。如需非同步輸出的更多相關資訊，請參閱非同步端點操作。
加密金鑰：如果您要加密您的輸出，可以輸入加密金鑰。

如需端點組態設定的更多相關資訊，請參閱 CreateEndpointConfig。

檢視一個端點的狀態和組態

若要檢視模型端點的狀態和組態，請完成下列步驟：

開啟 SageMaker AI 主控台。
選擇在左側面板中的控管。
選擇模型儀表板。
在模型儀表板的模型區段中，選取要檢視之端點的模型名稱。
選取在端點區段中的端點名稱。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

實體簡介

模型儀表板常見問題