Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Pour créer un point de terminaison multi-conteneurs (Boto 3)
Créez un point de terminaison multi-conteneurs en appelant CreateModelCreateEndpointConfig, et CreateEndpointAPIscomme vous le feriez pour créer n'importe quel autre point de terminaison. Vous pouvez exécuter ces conteneurs en séquence en tant que pipeline d'inférence, ou les appeler directement pour les exécuter individuellement. Les points de terminaison multi-conteneurs ont les exigences suivantes lorsque vous appelez create_model
:
-
Utilisez le paramètre
Containers
au lieu dePrimaryContainer
, et incluez plus d'un conteneur dans le paramètreContainers
. -
Le paramètre
ContainerHostname
est requis pour chaque conteneur d'un point de terminaison multi-conteneurs appelé directement. -
Définissez le paramètre
Mode
du champInferenceExecutionConfig
surDirect
pour appeler directement chaque conteneur, ou surSerial
pour utiliser les conteneurs en tant que pipeline d'inférence. Le mode par défaut estSerial
.
Note
Actuellement, un point de terminaison multi-conteneurs peut prendre en charge un maximum de 15 conteneurs.
L'exemple suivant crée un modèle multi-conteneurs pour l'appel direct.
-
Créez des éléments de conteneur et
InferenceExecutionConfig
avec appel direct.container1 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag', 'ContainerHostname': 'firstContainer' } container2 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag', 'ContainerHostname': 'secondContainer' } inferenceExecutionConfig = {'Mode': 'Direct'}
-
Créez le modèle avec les éléments de conteneur et définissez le champ
InferenceExecutionConfig
.import boto3 sm_client = boto3.Session().client('sagemaker') response = sm_client.create_model( ModelName = 'my-direct-mode-model-name', InferenceExecutionConfig = inferenceExecutionConfig, ExecutionRoleArn = role, Containers = [container1, container2] )
Pour créer un point de terminaison, appelez create_endpoint_config