Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Memanggil titik akhir tanpa server
Untuk melakukan inferensi menggunakan titik akhir tanpa server, Anda harus mengirim permintaan HTTP ke titik akhir. Anda dapat menggunakan InvokeEndpointAPI atau AWS CLI, yang membuat POST
permintaan untuk memanggil titik akhir Anda. Ukuran payload permintaan dan respons maksimum untuk pemanggilan tanpa server adalah 4 MB. Untuk titik akhir tanpa server:
Model harus diunduh dan server harus merespons dengan sukses
/ping
dalam waktu 3 menit.Batas waktu penampung untuk menanggapi permintaan inferensi
/invocations
adalah 1 menit.
Untuk memanggil titik akhir
Contoh berikut menggunakan AWS SDK for Python (Boto3) untuk memanggilInvokeEndpoint
, Anda harus menggunakan SageMaker Runtime Runtime sebagai klien. Tentukan nilai-nilai berikut ini:
-
Untuk
endpoint_name
, gunakan nama titik akhir tanpa server dalam layanan yang ingin Anda panggil. -
Untuk
content_type
, tentukan tipe MIME data masukan Anda di badan permintaan (misalnya,application/json
). -
Untuk
payload
, gunakan payload permintaan Anda untuk inferensi. Payload Anda harus dalam byte atau objek seperti file.
runtime = boto3.client("sagemaker-runtime") endpoint_name = "
<your-endpoint-name>
" content_type = "<request-mime-type>
" payload =<your-request-body>
response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )