Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Buat titik akhir multi-kontainer (Boto 3)
Buat titik akhir Multi-kontainer dengan memanggil CreateModel, CreateEndpointConfig, dan CreateEndpoint APIs seperti yang Anda lakukan untuk membuat titik akhir lainnya. Anda dapat menjalankan kontainer ini secara berurutan sebagai pipeline inferensi, atau menjalankan setiap kontainer individu dengan menggunakan pemanggilan langsung. Titik akhir multi-kontainer memiliki persyaratan berikut saat Anda menelepon: create_model
-
Gunakan
Containers
parameter alih-alihPrimaryContainer
, dan sertakan lebih dari satu wadah dalamContainers
parameter. -
ContainerHostname
Parameter diperlukan untuk setiap kontainer di titik akhir multi-kontainer dengan pemanggilan langsung. -
Atur
Mode
parameterInferenceExecutionConfig
bidangDirect
untuk pemanggilan langsung dari setiap kontainer, atauSerial
gunakan kontainer sebagai pipa inferensi. Mode default adalahSerial
.
catatan
Saat ini ada batas hingga 15 kontainer yang didukung pada titik akhir multi-kontainer.
Contoh berikut membuat model multi-container untuk pemanggilan langsung.
-
Buat elemen wadah dan
InferenceExecutionConfig
dengan pemanggilan langsung.container1 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage1:mytag', 'ContainerHostname': 'firstContainer' } container2 = { 'Image': '123456789012.dkr.ecr.us-east-1.amazonaws.com/myimage2:mytag', 'ContainerHostname': 'secondContainer' } inferenceExecutionConfig = {'Mode': 'Direct'}
-
Buat model dengan elemen wadah dan atur
InferenceExecutionConfig
bidang.import boto3 sm_client = boto3.Session().client('sagemaker') response = sm_client.create_model( ModelName = 'my-direct-mode-model-name', InferenceExecutionConfig = inferenceExecutionConfig, ExecutionRoleArn = role, Containers = [container1, container2] )
Untuk membuat endoint, Anda kemudian akan memanggil create_endpoint_config dan create_endpoint