Memanggil titik akhir tanpa server

Untuk melakukan inferensi menggunakan titik akhir tanpa server, Anda harus mengirim permintaan HTTP ke titik akhir. Anda dapat menggunakan InvokeEndpointAPI atau AWS CLI, yang membuat POST permintaan untuk memanggil titik akhir Anda. Ukuran payload permintaan dan respons maksimum untuk pemanggilan tanpa server adalah 4 MB. Untuk titik akhir tanpa server:

Model harus diunduh dan server harus merespons dengan sukses /ping dalam waktu 3 menit.
Batas waktu penampung untuk menanggapi permintaan inferensi /invocations adalah 1 menit.

Untuk memanggil titik akhir

Contoh berikut menggunakan AWS SDK for Python (Boto3) untuk memanggil API. InvokeEndpoint Perhatikan bahwa tidak seperti panggilan API lainnya dalam panduan ini, untukInvokeEndpoint, Anda harus menggunakan SageMaker Runtime Runtime sebagai klien. Tentukan nilai-nilai berikut ini:

Untukendpoint_name, gunakan nama titik akhir tanpa server dalam layanan yang ingin Anda panggil.
Untukcontent_type, tentukan tipe MIME data input Anda di badan permintaan (misalnya,application/json).
Untukpayload, gunakan payload permintaan Anda untuk inferensi. Payload Anda harus dalam byte atau objek seperti file.


runtime = boto3.client("sagemaker-runtime")

endpoint_name = "<your-endpoint-name>"
content_type = "<request-mime-type>"
payload = <your-request-body>

response = runtime.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType=content_type,
    Body=payload
)

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Buat titik akhir

Memperbarui titik akhir tanpa server