Amazon SageMaker Inference Recommender 的建議任務

焦點模式

此頁面是否有幫助？

Amazon SageMaker Inference Recommender 的建議任務 - Amazon SageMaker

Amazon SageMaker Inference Recommender 可以提出兩種類型的建議：

推論建議 (Default 任務類型) 會針對建議的執行個體類型執行一組負載測試。您也可以為無伺服器端點載入測試。您只需提供模型套件 Amazon Resource Name （ARN）即可啟動此類建議任務。推論建議任務可在 45 分鐘內完成。
端點建議 (Advanced 任務類型) 是以自訂負載測試為基礎，您可以在其中選取所需的機器學習 (ML) 執行個體或無伺服器端點、提供自訂流量模式，並根據生產需求提供延遲和輸送量需求。根據設定的任務持續時間和測試的推論組態總數，此任務平均需要 2 小時才能完成。

這兩種類型的建議都使用相同的 APIs 來建立、描述和停止任務。輸出為執行個體組態建議清單，其中包含相關的環境變數、成本、輸送量和延遲等指標。建議任務也提供初始執行個體計數，可用來設定自動擴展政策。若要區分這兩種類型的任務，當您透過 SageMaker 主控台或建立任務時APIs，請指定 Default 來建立初步端點建議，以及Advanced自訂負載測試和端點建議。

注意

您不需要在自己的工作流程中執行這兩種類型的建議任務。您可以獨立於另一個執行。

Inference Recommender 也可提供您預期執行個體清單，或針對模型部署的成本、輸送量和延遲進行最佳化的前五個執行個體類型，以及可信度分數。您可以在部署模型時選擇這些執行個體。Inference Recommender 會自動針對您的模型執行基準測試，方便您提供潛在的執行個體。由於這些是初步建議，因此建議您執行進一步的執行個體建議任務，以取得更準確的結果。若要檢視預期執行個體，請前往 SageMaker 模型詳細資訊頁面。如需詳細資訊，請參閱獲取即時的潛在執行個體。

主題

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

必要條件

獲取即時的潛在執行個體

選取您的 Cookie 偏好設定

自訂 Cookie 偏好設定

必要

效能

功能

廣告

無法儲存 Cookie 偏好設定

Amazon SageMaker Inference Recommender 的建議任務

此頁面是否有幫助？

注意

主題

下一個主題：

上一個主題：

需要協助？