Siapkan sumber daya pemanggilan model menggunakan profil inferensi

Profil inferensi adalah sumber daya di Amazon Bedrock yang mendefinisikan model dan satu atau beberapa Wilayah tempat profil inferensi dapat merutekan permintaan pemanggilan model. Anda dapat menggunakan profil inferensi untuk tugas-tugas berikut:

Lacak metrik penggunaan — Siapkan CloudWatch log dan kirimkan permintaan pemanggilan model dengan profil inferensi aplikasi untuk mengumpulkan metrik penggunaan untuk pemanggilan model. Anda dapat memeriksa metrik ini ketika Anda melihat informasi tentang profil inferensi dan menggunakannya untuk menginformasikan keputusan Anda. Untuk informasi selengkapnya tentang cara mengatur CloudWatch log, lihatMemantau pemanggilan model menggunakan CloudWatch Log dan Amazon S3.
Gunakan tag untuk memantau biaya — Lampirkan tag ke profil inferensi aplikasi untuk melacak biaya saat Anda mengirimkan permintaan pemanggilan model sesuai permintaan. Untuk informasi selengkapnya tentang cara menggunakan tag untuk alokasi biaya, lihat Mengatur dan melacak AWS biaya menggunakan tag alokasi biaya di panduan AWS Billing pengguna.
Cross-Region inferensi — Tingkatkan throughput Anda dengan menggunakan profil inferensi yang mencakup beberapa. Wilayah AWS Profil inferensi akan mendistribusikan permintaan pemanggilan model di seluruh Wilayah ini untuk meningkatkan throughput dan kinerja. Untuk informasi lebih lanjut tentang inferensi lintas wilayah, lihat. Tingkatkan throughput dengan inferensi lintas wilayah

Amazon Bedrock menawarkan jenis profil inferensi berikut:

Profil inferensi Lintas Wilayah (ditentukan sistem) — Profil inferensi yang telah ditentukan sebelumnya di Amazon Bedrock dan menyertakan beberapa Wilayah tempat permintaan model dapat dirutekan.
Profil inferensi aplikasi — Profil inferensi yang dibuat pengguna untuk melacak biaya dan penggunaan model. Anda dapat membuat profil inferensi yang merutekan permintaan pemanggilan model ke satu Wilayah atau ke beberapa Wilayah:
- Untuk membuat profil inferensi yang melacak biaya dan penggunaan model di satu Wilayah, tentukan model dasar di Wilayah tempat Anda ingin profil inferensi merutekan permintaan.
- Untuk membuat profil inferensi yang melacak biaya dan penggunaan model di beberapa Wilayah, tentukan profil inferensi lintas Wilayah (ditentukan sistem) yang mendefinisikan model dan Wilayah yang Anda inginkan profil inferensi untuk merutekan permintaan.

Anda dapat menggunakan profil inferensi dengan fitur berikut untuk merutekan permintaan ke beberapa Wilayah dan untuk melacak penggunaan dan biaya untuk permintaan pemanggilan yang dibuat dengan fitur-fitur ini:

Inferensi model — Gunakan profil inferensi saat menjalankan pemanggilan model dengan memilih profil inferensi di taman bermain di konsol Amazon Bedrock, atau dengan menentukan ARN profil inferensi saat memanggil,, Converse, dan operasi. InvokeModel InvokeModelWithResponseStream ConverseStream Untuk informasi selengkapnya, lihat Membuat permintaan inferensi.
Penyematan vektor basis pengetahuan dan pembuatan respons — Gunakan profil inferensi saat menghasilkan respons setelah menanyakan basis pengetahuan atau saat mengurai informasi non-tekstual dalam sumber data. Untuk informasi selengkapnya, lihat Uji basis pengetahuan Anda dengan pertanyaan dan tanggapan dan Opsi penguraian untuk sumber data Anda.
Evaluasi model — Anda dapat mengirimkan profil inferensi sebagai model untuk mengevaluasi saat mengirimkan pekerjaan evaluasi model. Untuk informasi selengkapnya, lihat Evaluasi kinerja sumber daya Amazon Bedrock.
Manajemen cepat - Anda dapat menggunakan profil inferensi saat menghasilkan respons untuk prompt yang Anda buat di Manajemen Prompt. Untuk informasi selengkapnya, lihat Buat dan simpan petunjuk yang dapat digunakan kembali dengan manajemen Prompt di Amazon Bedrock
Aliran - Anda dapat menggunakan profil inferensi saat menghasilkan respons untuk prompt yang Anda tentukan sebaris dalam simpul prompt dalam alur. Untuk informasi selengkapnya, lihat Bangun alur kerja AI generatif ujung ke ujung dengan Amazon Bedrock Flows.

Harga untuk menggunakan profil inferensi dihitung berdasarkan harga model di Wilayah tempat Anda memanggil profil inferensi. Untuk informasi tentang harga, lihat harga Amazon Bedrock.

Untuk detail selengkapnya tentang throughput yang dapat ditawarkan oleh profil inferensi lintas wilayah, lihat. Tingkatkan throughput dengan inferensi lintas wilayah

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Inferensi lintas wilayah global

Daerah dan model yang Didukung