Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Siapkan sumber daya pemanggilan model menggunakan profil inferensi

Mode fokus
Siapkan sumber daya pemanggilan model menggunakan profil inferensi - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Profil inferensi adalah sumber daya di Amazon Bedrock yang mendefinisikan model dan satu atau beberapa Wilayah tempat profil inferensi dapat merutekan permintaan pemanggilan model. Anda dapat menggunakan profil inferensi untuk tugas-tugas berikut:

  • Lacak metrik penggunaan — Siapkan CloudWatch log dan kirimkan permintaan pemanggilan model dengan profil inferensi aplikasi untuk mengumpulkan metrik penggunaan untuk pemanggilan model. Anda dapat memeriksa metrik ini ketika Anda melihat informasi tentang profil inferensi dan menggunakannya untuk menginformasikan keputusan Anda. Untuk informasi selengkapnya tentang cara mengatur CloudWatch log, lihatMemantau pemanggilan model menggunakan Log CloudWatch .

  • Gunakan tag untuk memantau biaya — Lampirkan tag ke profil inferensi aplikasi untuk melacak biaya saat Anda mengirimkan permintaan pemanggilan model sesuai permintaan. Untuk informasi selengkapnya tentang cara menggunakan tag untuk alokasi biaya, lihat Mengatur dan melacak AWS biaya menggunakan tag alokasi biaya di panduan AWS Billing pengguna.

  • Inferensi lintas wilayah — Tingkatkan throughput Anda dengan menggunakan profil inferensi yang mencakup beberapa. Wilayah AWS Profil inferensi akan mendistribusikan permintaan pemanggilan model di seluruh wilayah ini untuk meningkatkan throughput dan kinerja. Untuk informasi lebih lanjut tentang inferensi lintas wilayah, lihat. Tingkatkan throughput dengan inferensi lintas wilayah

Amazon Bedrock menawarkan jenis profil inferensi berikut:

  • Profil inferensi lintas wilayah (ditentukan sistem) — Profil inferensi yang telah ditentukan sebelumnya di Amazon Bedrock dan menyertakan beberapa Wilayah tempat permintaan model dapat dirutekan.

  • Profil inferensi aplikasi — Profil inferensi yang dibuat pengguna untuk melacak biaya dan penggunaan model. Anda dapat membuat profil inferensi yang merutekan permintaan pemanggilan model ke satu Wilayah atau ke beberapa Wilayah:

    • Untuk membuat profil inferensi yang melacak biaya dan penggunaan model di satu Wilayah, tentukan model dasar di Wilayah tempat Anda ingin profil inferensi merutekan permintaan.

    • Untuk membuat profil inferensi yang melacak biaya dan penggunaan model di beberapa Wilayah, tentukan profil inferensi lintas wilayah (ditentukan sistem) yang mendefinisikan model dan Wilayah yang Anda inginkan profil inferensi untuk merutekan permintaan.

Anda dapat menggunakan profil inferensi dengan fitur berikut untuk merutekan permintaan ke beberapa Wilayah dan untuk melacak penggunaan dan biaya untuk permintaan pemanggilan yang dibuat dengan fitur-fitur ini:

Harga untuk menggunakan profil inferensi dihitung berdasarkan harga model di wilayah tempat Anda memanggil profil inferensi. Untuk informasi tentang harga, lihat harga Amazon Bedrock.

Untuk detail lebih lanjut tentang throughput yang dapat ditawarkan oleh profil inferensi lintas wilayah, lihat. Tingkatkan throughput dengan inferensi lintas wilayah

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.