建立多容器端點 (Boto 3)

透過呼叫 CreateModel、CreateEndpointConfig 和 CreateEndpoint API，來建立多容器端點，方法就如同建立任何其他端點一樣。您可以循序執行這些容器作為推論管道，或使用直接調用來執行每個個別的容器。多容器端點在您呼叫 create_model 時具有下列要求：

請改用 Containers參數而非 PrimaryContainer，並在 Containers參數中納入超過一個容器。
具有直接調用的多容器端點中的每個容器都需要 ContainerHostname參數。
將 InferenceExecutionConfig欄位的 Mode參數設為 Direct，以直接調用每個容器，或透過 Serial來使用容器作為推論管道。預設模式為 Serial。

注意

目前，設有多容器端點最多支援 15 個容器的限制。

下列範例中會建立多容器模型以供直接調用。

透過直接調用建立容器元素和 InferenceExecutionConfig。


container1 = {
                 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag',
                 'ContainerHostname': 'firstContainer'
             }

container2 = {
                 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag',
                 'ContainerHostname': 'secondContainer'
             }
inferenceExecutionConfig = {'Mode': 'Direct'}

使用容器元素建立模型並設定 InferenceExecutionConfig欄位。


import boto3
sm_client = boto3.Session().client('sagemaker')

response = sm_client.create_model(
               ModelName = 'my-direct-mode-model-name',
               InferenceExecutionConfig = inferenceExecutionConfig,
               ExecutionRoleArn = role,
               Containers = [container1, container2]
           )

若要建立端點，您必須像建立任何其他端點一樣，呼叫 create_endpoint_config 和 create_endpoint。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

文件慣用形式

多容器端點

更新多容器端點