本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
監控 Amazon Comprehend 點
您可以透過增加或減少推論單元 (IU) 的數目來調整端點的輸送量。如需更新端點的詳細資訊,請參閱更新 Amazon Comprehend 端點。
您可以透過 Amazon CloudWatch 主控台監控端點的使用情況,決定如何最佳調整端點的輸送量。
監控您的端點使用情況 CloudWatch
-
登入 AWS Management Console 並開啟CloudWatch 主控台
。 -
在左側選擇「量度」,然後選取「所有量度」。
-
在 [所有量度] 下,選擇 [Comprehend]。
-
主 CloudWatch 控台會顯示 Comprehend 量度的維度。選擇EndpointArn尺寸。
主控台會ProvisionedInferenceUnitsInferenceUtilization針對每個端點顯示ConsumedInferenceUnits、、和。RequestedInferenceUnits
選取四個量度,然後瀏覽至「圖形化量度」標籤。
-
將「統計資料」欄設定為「總RequestedInferenceUnits和 ConsumedInferenceUnits」。
-
將的統計資料欄設定為 InferenceUtilization「總和」。
-
ProvisionedInferenceUnits將「統計值」欄設定為「平均」。
-
將所有測量結果的「期間」欄變更為 1 分鐘。
-
選取InferenceUtilization並選取箭頭,將其移至單獨的 Y 軸。
您的圖表已準備好進行分析。
根據 CloudWatch 指標,您還可以設置自 auto 擴展以自動調整端點的輸送量。如需將 auto 調整與端點搭配使用的詳細資訊,請參閱使用端點自動擴展。
-
ProvisionedInferenceUnits-此量度代表提出要求時的平均佈建 IU 數目。
-
RequestedInferenceUnits-這是基於提交給已發送要處理的服務的每個請求的使用情況。這對於將發送要處理的請求與實際處理的請求進行比較而不會調節()ConsumedInferenceUnits會很有幫助。此量度的值是透過取得要處理的傳送字元數,除以 1 IU 可在一分鐘內處理的字元數目來計算。
-
ConsumedInferenceUnits-這是根據提交至已成功處理 (未限制) 之服務的每個要求使用量而定。當您將使用的項目與佈建的 IU 進行比較時,這會很有幫助。此量度的值是以處理的字元數除以 1 IU 可在一分鐘內處理的字元數來計算。
-
InferenceUtilization-這是每個請求發出。此值的計算方法是取得中定義的已耗用 IU,ConsumedInferenceUnits並將其除以,ProvisionedInferenceUnits然後轉換為 100 以外的百分比。
注意
只有成功的要求才會發出所有量度。如果量度來自限制的要求或失敗,並出現內部伺服器錯誤或客戶錯誤,則不會顯示該量度。