Inferensi asinkron - Amazon SageMaker

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Inferensi asinkron

Amazon SageMaker Asynchronous Inference adalah kemampuan yang mengantrekan permintaan yang masuk dan SageMaker memprosesnya secara asinkron. Opsi ini sangat ideal untuk permintaan dengan ukuran muatan besar (hingga 1GB), waktu pemrosesan yang lama (hingga satu jam), dan persyaratan latensi mendekati waktu nyata. Inferensi Asinkron memungkinkan Anda menghemat biaya dengan menskalakan otomatis jumlah instans ke nol saat tidak ada permintaan untuk diproses, jadi Anda hanya membayar saat titik akhir memproses permintaan.

Cara Kerjanya

Membuat titik akhir inferensi asinkron mirip dengan membuat titik akhir inferensi waktu nyata. Anda dapat menggunakan SageMaker model yang ada dan hanya perlu menentukan AsyncInferenceConfig objek saat membuat konfigurasi titik akhir Anda dengan EndpointConfig bidang di CreateEndpointConfig API. Diagram berikut menunjukkan arsitektur dan alur kerja Inferensi Asinkron.

Diagram arsitektur Inferensi Asinkron yang menunjukkan bagaimana pengguna memanggil titik akhir.

Untuk memanggil titik akhir, Anda harus menempatkan payload permintaan di Amazon S3. Anda juga perlu memberikan pointer ke muatan ini sebagai bagian dari permintaan. InvokeEndpointAsync Setelah pemanggilan, SageMaker antrian permintaan untuk diproses dan mengembalikan pengenal dan lokasi output sebagai respons. Setelah diproses, SageMaker tempatkan hasilnya di lokasi Amazon S3. Anda secara opsional dapat memilih untuk menerima pemberitahuan sukses atau kesalahan dengan Amazon SNS. Untuk informasi selengkapnya tentang cara mengatur notifikasi asinkron, lihat. Periksa hasil prediksi

catatan

Kehadiran objek konfigurasi inferensi asinkron (AsyncInferenceConfig) dalam konfigurasi titik akhir menyiratkan bahwa titik akhir hanya dapat menerima pemanggilan asinkron.

Bagaimana Saya Memulai?

Jika Anda adalah pengguna pertama kali Inferensi SageMaker Asinkron Amazon, kami sarankan Anda melakukan hal berikut:

Perhatikan bahwa jika titik akhir Anda menggunakan salah satu fitur yang tercantum di Pengecualian halaman ini, Anda tidak dapat menggunakan Inferensi Asinkron.