本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
建立多容器端點 (Boto 3)
呼叫 CreateModel、 和 來建立多容器端點CreateEndpointConfig,就像建立任何其他端點CreateEndpointAPIs一樣。您可以循序執行這些容器作為推論管道,或使用直接調用來執行每個個別的容器。多容器端點在您呼叫 create_model
時具有下列要求:
-
請改用
Containers
參數而非PrimaryContainer
,並在Containers
參數中納入超過一個容器。 -
具有直接調用的多容器端點中的每個容器都需要
ContainerHostname
參數。 -
將
InferenceExecutionConfig
欄位的Mode
參數設為Direct
,以直接調用每個容器,或透過Serial
來使用容器作為推論管道。預設模式為Serial
。
注意
目前,設有多容器端點最多支援 15 個容器的限制。
下列範例中會建立多容器模型以供直接調用。
-
透過直接調用建立容器元素和
InferenceExecutionConfig
。container1 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag', 'ContainerHostname': 'firstContainer' } container2 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag', 'ContainerHostname': 'secondContainer' } inferenceExecutionConfig = {'Mode': 'Direct'}
-
使用容器元素建立模型並設定
InferenceExecutionConfig
欄位。import boto3 sm_client = boto3.Session().client('sagemaker') response = sm_client.create_model( ModelName = 'my-direct-mode-model-name', InferenceExecutionConfig = inferenceExecutionConfig, ExecutionRoleArn = role, Containers = [container1, container2] )
若要建立端點,您必須像建立任何其他端點一樣,呼叫 create_endpoint_config