建立端點組態 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立端點組態

建立模型後,請建立端點組態。然後,您可以使用端點組態中的規格來部署模型。在組態中,您可以指定要即時或無伺服器端點。若要建立無伺服器端點組態,您可以使用 Amazon SageMaker 主控台 CreateEndpointConfig API或 AWS CLI。API 和 主控台方法概述於下列各節。

建立端點組態 (使用 API)

下列範例使用 AWS SDK for Python (Boto3) 呼叫 CreateEndpointConfig API。指定下列值:

  • EndpointConfigName,選擇端點組態的名稱。名稱在您帳戶的區域內應為唯一。

  • (選用) 針對ARN AWS KMS 您要使用的金鑰KmsKeyId,使用金鑰 ID、金鑰、ARN別名名稱或別名。 SageMaker 使用此金鑰來加密您的 Amazon ECR映像。

  • ModelName 中,請使用您要部署的模型名稱。應該與您在建立模型步驟中使用的模型相同。

  • ServerlessConfig 中:

    • MemorySizeInMB 設定為 2048。在此範例中,我們將記憶體大小設定為 2048 MB,但您可以為記憶體大小選擇以下任意值:1024 MB、2048 MB、3072 MB、4096 MB、5120 MB 或 6144 MB。

    • MaxConcurrency 設定為 20。在此範例中,我們將並行上限設定為 20。您可以將無伺服器端點的並行調用數量上限設定為 200,並選擇的最小值為 1。

    • (選用) 若要使用佈建並行,請設定 ProvisionedConcurrency 為 10。在此範例中,我們將佈建並行設定為 10。無伺服器端點的 ProvisionedConcurrency 數量必須小於或等於 MaxConcurrency 數字。如果您想要使用隨需無伺服器推論端點,可以將其保留空白。您可以動態擴展佈建並行。如需詳細資訊,請參閱針對無伺服器端點自動擴展佈建並行

response = client.create_endpoint_config( EndpointConfigName="<your-endpoint-configuration>", KmsKeyId="arn:aws:kms:us-east-1:123456789012:key/143ef68f-76fd-45e3-abba-ed28fc8d3d5e", ProductionVariants=[ { "ModelName": "<your-model-name>", "VariantName": "AllTraffic", "ServerlessConfig": { "MemorySizeInMB": 2048, "MaxConcurrency": 20, "ProvisionedConcurrency": 10, } } ] )

建立端點組態 (使用主控台)

  1. 登入 Amazon SageMaker 主控台

  2. 在導覽索引標記中,選擇推論

  3. 接著,選擇端點組態

  4. 選擇 建立端點組態

  5. 端點組態名稱中,輸入您在區域帳戶中的唯一名稱。

  6. 選取無伺服器做為端點的類型

    在主控台中,端點類型選項的螢幕擷取畫面。
  7. 生產變體中,選擇新增模型

  8. 新增模型下,從模型清單中選取您要使用的模型,然後選擇儲存

  9. 新增模型後,在動作 下選擇編輯

  10. 記憶體大小 中,選擇您想要的記憶體大小 (GB)。

    在主控台中,記憶體大小選項的螢幕擷取畫面。
  11. 最大並行數中,輸入您所需的端點並行調用上限。您可以輸入的最大值為 200,下限值為 1。

  12. (選用) 若要使用佈建並行,請在佈建並行設定欄位中輸入所需的並行調用數。佈建並行調用的數量,必須小於或等於並行調用上限數。

  13. 選擇 Save (儲存)。

  14. (選用) 在標籤 中,如果您想要為端點組態建立中繼資料,請輸入鍵值對。

  15. 選擇建立端點組態