Memanggil titik akhir tanpa server - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Memanggil titik akhir tanpa server

Untuk melakukan inferensi menggunakan titik akhir tanpa server, Anda harus mengirim permintaan HTTP ke titik akhir. Anda dapat menggunakan InvokeEndpointAPI atau AWS CLI, yang membuat POST permintaan untuk memanggil titik akhir Anda. Ukuran payload permintaan dan respons maksimum untuk pemanggilan tanpa server adalah 4 MB. Untuk titik akhir tanpa server:

  • Model harus diunduh dan server harus merespons dengan sukses /ping dalam waktu 3 menit.

  • Batas waktu penampung untuk menanggapi permintaan inferensi /invocations adalah 1 menit.

Untuk memanggil titik akhir

Contoh berikut menggunakan AWS SDK for Python (Boto3) untuk memanggil API. InvokeEndpoint Perhatikan bahwa tidak seperti panggilan API lainnya dalam panduan ini, untukInvokeEndpoint, Anda harus menggunakan SageMaker Runtime Runtime sebagai klien. Tentukan nilai-nilai berikut ini:

  • Untukendpoint_name, gunakan nama titik akhir tanpa server dalam layanan yang ingin Anda panggil.

  • Untukcontent_type, tentukan tipe MIME data masukan Anda di badan permintaan (misalnya,application/json).

  • Untukpayload, gunakan payload permintaan Anda untuk inferensi. Payload Anda harus dalam byte atau objek seperti file.

runtime = boto3.client("sagemaker-runtime") endpoint_name = "<your-endpoint-name>" content_type = "<request-mime-type>" payload = <your-request-body> response = runtime.invoke_endpoint( EndpointName=endpoint_name, ContentType=content_type, Body=payload )