Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Per creare un endpoint multi-container (Boto 3)
Crea un endpoint multi-contenitore chiamando CreateModelCreateEndpointConfig, e CreateEndpointAPIscome faresti per creare qualsiasi altro endpoint. Puoi eseguire questi container in sequenza come pipeline di inferenza o eseguire ogni singolo container utilizzando la chiamata diretta. Gli endpoint multi-container presentano i seguenti requisiti per le chiamate create_model
:
-
Utilizza il parametro
Containers
anzichéPrimaryContainer
e includi più di un container nel parametroContainers
. -
Il parametro
ContainerHostname
è obbligatorio per ogni container in un endpoint multi-container con invocazione diretta. -
Imposta il parametro
Mode
del campoInferenceExecutionConfig
per l'invocazione direttaDirect
di ogni container oSerial
per utilizzare i come pipeline di inferenza. La modalità predefinita èSerial
.
Nota
Attualmente esiste un limite massimo di 15 container supportati su un endpoint multi-container.
L'esempio seguente crea un modello multi-container per l'invocazione diretta.
-
Crea elementi container e
InferenceExecutionConfig
con invocazione diretta.container1 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag', 'ContainerHostname': 'firstContainer' } container2 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag', 'ContainerHostname': 'secondContainer' } inferenceExecutionConfig = {'Mode': 'Direct'}
-
Crea il modello con gli elementi del container e imposta il campo
InferenceExecutionConfig
.import boto3 sm_client = boto3.Session().client('sagemaker') response = sm_client.create_model( ModelName = 'my-direct-mode-model-name', InferenceExecutionConfig = inferenceExecutionConfig, ExecutionRoleArn = role, Containers = [container1, container2] )
Per creare un endpoint, devi quindi chiamare create_endpoint_config