自動擴展多容器端點

如果您想要使用 InvocationsPerInstance 指標為多容器端點設定自動擴展，建議每個容器中的模型在每個推論請求上顯示類似的CPU使用率和延遲。建議這樣做，因為如果多容器端點的流量從低CPU使用率模型轉移到高CPU使用率模型，但整體呼叫量保持不變，端點不會橫向擴展，並且可能沒有足夠的執行個體來處理高CPU使用率模型的所有請求。如需設定自動擴展端點的資訊，請參閱Amazon SageMaker 模型的自動擴展。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。