Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Peramalan waktu nyata
Peramalan waktu nyata berguna ketika Anda perlu menghasilkan prediksi on-the-fly, seperti untuk aplikasi yang memerlukan tanggapan segera atau saat memperkirakan titik data individual.
Dengan menerapkan model AutoML Anda sebagai titik akhir waktu nyata, Anda dapat menghasilkan perkiraan sesuai permintaan dan meminimalkan latensi antara menerima data baru dan mendapatkan prediksi. Ini membuat peramalan waktu nyata cocok untuk aplikasi yang membutuhkan kemampuan peramalan langsung, dipersonalisasi, atau didorong oleh peristiwa.
Untuk peramalan waktu nyata, kumpulan data harus menjadi bagian dari kumpulan data input. Titik akhir waktu nyata memiliki ukuran data input sekitar 6MB dan batasan batas waktu respons 60 detik. Kami merekomendasikan membawa satu atau beberapa item sekaligus.
Anda dapat menggunakan SageMaker APIs untuk mengambil kandidat terbaik dari pekerjaan AutoML dan kemudian membuat titik akhir SageMaker menggunakan kandidat itu.
Atau, Anda dapat memilih opsi penerapan otomatis saat membuat eksperimen Autopilot Anda. Untuk informasi tentang pengaturan penerapan otomatis model, lihatCara mengaktifkan penyebaran otomatis.
Untuk membuat SageMaker titik akhir menggunakan kandidat model terbaik Anda:
-
Ambil detail pekerjaan AutoML.
Contoh AWS CLI perintah berikut menggunakan DescribeAutoMLJobV2APIuntuk mendapatkan rincian pekerjaan AutoML, termasuk informasi tentang kandidat model terbaik.
aws sagemaker describe-auto-ml-job-v2 --auto-ml-job-name
job-name
--regionregion
-
Ekstrak definisi wadah dari InferenceContainerskandidat model terbaik.
Definisi kontainer adalah lingkungan kontainer yang digunakan untuk meng-host SageMaker model terlatih untuk membuat prediksi.
BEST_CANDIDATE=$(aws sagemaker describe-auto-ml-job-v2 \ --auto-ml-job-name
job-name
--regionregion
\ --query 'BestCandidate.InferenceContainers[0]' \ --output jsonPerintah ini mengekstrak definisi wadah untuk kandidat model terbaik dan menyimpannya dalam
BEST_CANDIDATE
variabel. -
Buat SageMaker model menggunakan definisi kontainer kandidat terbaik.
Gunakan definisi kontainer dari langkah sebelumnya untuk membuat SageMaker model dengan menggunakan CreateModelAPI.
aws sagemaker create-model \ --model-name '
your-candidate-name>
' \ --primary-container "$BEST_CANDIDATE" --execution-role-arn 'execution-role-arn>
' \ --region 'region>
--execution-role-arn
Parameter menentukan IAM peran yang SageMaker mengasumsikan saat menggunakan model untuk inferensi. Untuk detail tentang izin yang diperlukan untuk peran ini, lihat CreateModel API: Izin Peran Eksekusi. -
Buat konfigurasi SageMaker titik akhir menggunakan model.
AWS CLI Perintah berikut menggunakan CreateEndpointConfigAPIuntuk membuat konfigurasi endpoint.
aws sagemaker create-endpoint-config \ --production-variants file://production-variants.json \ --region '
region
'Dimana
production-variants.json
file berisi konfigurasi model, termasuk nama model dan jenis instance.catatan
Sebaiknya gunakan instans m5.12xlarge
untuk peramalan waktu nyata. [ { "VariantName": "
variant-name
", "ModelName": "model-name
", "InitialInstanceCount":1
, "InstanceType": "m5.12xlarge
" } ] } -
Buat SageMaker endpoint menggunakan konfigurasi endpoint.
AWS CLI Contoh berikut menggunakan CreateEndpointAPIuntuk membuat endpoint.
aws sagemaker create-endpoint \ --endpoint-name '
endpoint-name>
' \ --endpoint-config-name 'endpoint-config-name
' \ --region 'region
'Periksa kemajuan penerapan titik akhir inferensi real-time Anda dengan menggunakan. DescribeEndpointAPI Lihat AWS CLI perintah berikut sebagai contoh.
aws sagemaker describe-endpoint \ --endpoint-name '
endpoint-name
' \ --region 'region
'Setelah
EndpointStatus
perubahanInService
, titik akhir siap digunakan untuk inferensi waktu nyata. -
Panggil SageMaker titik akhir untuk membuat prediksi.
aws sagemaker invoke-endpoint \ --endpoint-name '
endpoint-name
' \ --region 'region
' \ --body file://input-data-in-bytes.json \ --content-type 'application/json
'outfile
Dimana
input-data-in-bytes.json
file berisi data input untuk prediksi.