Titik akhir dan kuota Amazon Bedrock

Mode fokus

Titik akhir dan kuota Amazon Bedrock - AWS Referensi Umum

Titik akhir layanan Amazon Bedrock Kuota layanan Amazon Bedrock

Untuk terhubung secara terprogram ke AWS layanan, Anda menggunakan titik akhir. AWS layanan menawarkan jenis titik akhir berikut di beberapa atau semua AWS Wilayah yang didukung layanan: titik akhir, IPv4 titik akhir tumpukan ganda, dan titik akhir FIPS. Beberapa layanan menyediakan titik akhir global. Untuk informasi selengkapnya, lihat AWS titik akhir layanan.

Kuota layanan, juga disebut sebagai batas, adalah jumlah maksimum sumber daya layanan atau operasi untuk AWS akun Anda. Untuk informasi selengkapnya, lihat AWS kuota layanan.

Berikut ini adalah titik akhir layanan dan kuota layanan untuk layanan ini.

Titik akhir layanan Amazon Bedrock

Pesawat kontrol Amazon Bedrock APIs

Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk mengelola, melatih, dan menerapkan model. Gunakan titik akhir ini untuk operasi Amazon Bedrock API.

Nama Wilayah	Wilayah	Titik Akhir	Protokol
AS Timur (Ohio)	us–east-2	bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com	HTTPS HTTPS
AS Timur (Virginia Utara)	us-east-1	bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com	HTTPS HTTPS
US West (Oregon)	us-west-2	bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Asia Pasifik (Hyderabad)	ap-south-2	bedrock.ap-south-2.amazonaws.com	HTTPS
Asia Pasifik (Mumbai)	ap-south-1	bedrock.ap-south-1.amazonaws.com	HTTPS
Asia Pasifik (Osaka)	ap-northeast-3	bedrock.ap-northeast-3.amazonaws.com	HTTPS
Asia Pasifik (Seoul)	ap-northeast-2	bedrock.ap-northeast-2.amazonaws.com	HTTPS
Asia Pasifik (Singapura)	ap-southeast-1	bedrock.ap-southeast-1.amazonaws.com	HTTPS
Asia Pacific (Sydney)	ap-southeast-2	bedrock.ap-southeast-2.amazonaws.com	HTTPS
Asia Pacific (Tokyo)	ap-northeast-1	bedrock.ap-northeast-1.amazonaws.com	HTTPS
Canada (Central)	ca-central-1	bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Eropa (Frankfurt)	eu-central-1	bedrock.eu-central-1.amazonaws.com	HTTPS
Eropa (Irlandia)	eu-west-1	bedrock.eu-west-1.amazonaws.com	HTTPS
Europe (London)	eu-west-2	bedrock.eu-west-2.amazonaws.com	HTTPS
Eropa (Milan)	eu-south-1	bedrock.eu-south-1.amazonaws.com	HTTPS
Eropa (Paris)	eu-west-3	bedrock.eu-west-3.amazonaws.com	HTTPS
Eropa (Spanyol)	eu-south-2	bedrock.eu-south-2.amazonaws.com	HTTPS
Eropa (Stockholm)	eu-north-1	bedrock.eu-north-1.amazonaws.com	HTTPS
Eropa (Zürich)	eu-central-2	bedrock.eu-central-2.amazonaws.com	HTTPS
Amerika Selatan (Sao Paulo)	sa-east-1	bedrock.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (AS-Timur)	us-gov-east-1	bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (AS-Barat)	us-gov-west-1	bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Waktu proses Amazon Bedrock APIs

Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk membuat permintaan inferensi untuk model yang dihosting di Amazon Bedrock. Gunakan titik akhir ini untuk operasi Amazon Bedrock Runtime API.

Nama Wilayah	Wilayah	Titik Akhir	Protokol
AS Timur (Ohio)	us–east-2	bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com	HTTPS HTTPS
AS Timur (Virginia Utara)	us-east-1	bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com	HTTPS HTTPS
US West (Oregon)	us-west-2	bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com	HTTPS HTTPS
Asia Pasifik (Hyderabad)	ap-south-2	bedrock-runtime.ap-south-2.amazonaws.com	HTTPS
Asia Pasifik (Mumbai)	ap-south-1	bedrock-runtime.ap-south-1.amazonaws.com	HTTPS
Asia Pasifik (Osaka)	ap-northeast-3	bedrock-runtime.ap-northeast-3.amazonaws.com	HTTPS
Asia Pasifik (Seoul)	ap-northeast-2	bedrock-runtime.ap-northeast-2.amazonaws.com	HTTPS
Asia Pasifik (Singapura)	ap-southeast-1	bedrock-runtime.ap-southeast-1.amazonaws.com	HTTPS
Asia Pacific (Sydney)	ap-southeast-2	bedrock-runtime.ap-southeast-2.amazonaws.com	HTTPS
Asia Pacific (Tokyo)	ap-northeast-1	bedrock-runtime.ap-northeast-1.amazonaws.com	HTTPS
Canada (Central)	ca-central-1	bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com	HTTPS HTTPS
Eropa (Frankfurt)	eu-central-1	bedrock-runtime.eu-central-1.amazonaws.com	HTTPS
Eropa (Irlandia)	eu-west-1	bedrock-runtime.eu-west-1.amazonaws.com	HTTPS
Europe (London)	eu-west-2	bedrock-runtime.eu-west-2.amazonaws.com	HTTPS
Eropa (Milan)	eu-south-1	bedrock-runtime.eu-south-1.amazonaws.com	HTTPS
Eropa (Paris)	eu-west-3	bedrock-runtime.eu-west-3.amazonaws.com	HTTPS
Eropa (Spanyol)	eu-south-2	bedrock-runtime.eu-south-2.amazonaws.com	HTTPS
Eropa (Stockholm)	eu-north-1	bedrock-runtime.eu-north-1.amazonaws.com	HTTPS
Eropa (Zürich)	eu-central-2	bedrock-runtime.eu-central-2.amazonaws.com	HTTPS
Amerika Selatan (Sao Paulo)	sa-east-1	bedrock-runtime.sa-east-1.amazonaws.com	HTTPS
AWS GovCloud (AS-Timur)	us-gov-east-1	bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com	HTTPS HTTPS
AWS GovCloud (AS-Barat)	us-gov-west-1	bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com	HTTPS HTTPS

Agen untuk waktu pembuatan Amazon Bedrock APIs

Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk membuat dan mengelola agen dan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Amazon Bedrock API.

Nama Wilayah	Wilayah	Titik Akhir	Protokol
US East (N. Virginia)	us-east-1	bedrock-agent.us-east-1.amazonaws.com	HTTPS
US East (N. Virginia)	us-east-1	bedrock-agent-fips.us-east-1.amazonaws.com	HTTPS
US West (Oregon)	us-west-2	bedrock-agent.us-west-2.amazonaws.com	HTTPS
US West (Oregon)	us-west-2	bedrock-agent-fips.us-west-2.amazonaws.com	HTTPS
Asia Pacific (Singapore)	ap-southeast-1	bedrock-agent.ap-southeast-1.amazonaws.com	HTTPS
Asia Pacific (Sydney)	ap-southeast-2	bedrock-agent.ap-southeast-2.amazonaws.com	HTTPS
Asia Pacific (Tokyo)	ap-northeast-1	bedrock-agent.ap-northeast-1.amazonaws.com	HTTPS
Canada (Central)	ca-central-1	bedrock-agent.ca-central-1.amazonaws.com	HTTPS
Europe (Frankfurt)	eu-central-1	bedrock-agent.eu-central-1.amazonaws.com	HTTPS
Europe (Ireland)	eu-west-1	bedrock-agent.eu-west-1.amazonaws.com	HTTPS
Europe (London)	eu-west-2	bedrock-agent.eu-west-2.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent.eu-west-3.amazonaws.com	HTTPS
Asia Pacific (Mumbai)	ap-south-1	bedrock-agent.ap-south-1.amazonaws.com	HTTPS
South America (São Paulo)	sa-east-1	bedrock-agent.sa-east-1.amazonaws.com	HTTPS

Agen untuk runtime Amazon Bedrock APIs

Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk memanggil agen dan menanyakan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Amazon Bedrock Runtime API.

Nama Wilayah	Wilayah	Titik Akhir	Protokol
US East (N. Virginia)	us-east-1	bedrock-agent-runtime.us-east-1.amazonaws.com	HTTPS
US East (N. Virginia)	us-east-1	bedrock-agent-runtime-fips.us-east-1.amazonaws.com	HTTPS
US West (Oregon)	us-west-2	bedrock-agent-runtime.us-west-2.amazonaws.com	HTTPS
US West (Oregon)	us-west-2	bedrock-agent-runtime-fips.us-west-2.amazonaws.com	HTTPS
Asia Pacific (Singapore)	ap-southeast-1	bedrock-agent-runtime.ap-tenggara 1.amazonaws.com	HTTPS
Asia Pacific (Sydney)	ap-southeast-2	bedrock-agent-runtime.ap-tenggara 2.amazonaws.com	HTTPS
Asia Pacific (Tokyo)	ap-northeast-1	bedrock-agent-runtime.ap-northeast-1.amazonaws.com	HTTPS
Canada (Central)	ca-central-1	bedrock-agent-runtime.ca-central-1.amazonaws.com	HTTPS
Europe (Frankfurt)	eu-central-1	bedrock-agent-runtime.eu-central-1.amazonaws.com	HTTPS
Europe (Paris)	eu-west-3	bedrock-agent-runtime.eu-west-3.amazonaws.com	HTTPS
Europe (Ireland)	eu-west-1	bedrock-agent-runtime.eu-west-1.amazonaws.com	HTTPS
Europe (London)	eu-west-2	bedrock-agent-runtime.eu-west-2.amazonaws.com	HTTPS
Asia Pacific (Mumbai)	ap-south-1	bedrock-agent-runtime.ap-selatan-1.amazonaws.com	HTTPS
South America (São Paulo)	sa-east-1	bedrock-agent-runtime.sa-timur-1.amazonaws.com	HTTPS

Kuota layanan Amazon Bedrock

Bagian ini menjelaskan kuota tingkat layanan Amazon Bedrock.

catatan

Anda dapat meminta kenaikan kuota untuk akun Anda dengan mengikuti langkah-langkah di bawah ini:

Jika kuota ditandai sebagai Ya di kolom Adjustable, Anda dapat menyesuaikannya dengan mengikuti langkah-langkah di Meminta Peningkatan Kuota pada Panduan Pengguna Service Quotas.
Jika kuota ditandai sebagai Tidak di kolom Adjustable, Anda dapat mengirimkan permintaan melalui formulir peningkatan batas untuk dipertimbangkan untuk kenaikan.
Kuota pemanggilan model On-Demand tidak dapat disesuaikan melalui Service Quotas. Hubungi Akun AWS manajer Anda untuk dipertimbangkan untuk peningkatan. Karena permintaan yang luar biasa, prioritas akan diberikan kepada pelanggan yang menghasilkan lalu lintas yang mengkonsumsi alokasi kuota yang ada. Permintaan Anda mungkin ditolak jika Anda tidak memenuhi persyaratan ini.

Untuk melihat kuota layanan untuk Amazon Bedrock di antarmuka konsol, ikuti langkah-langkah di Melihat kuota layanan dan pilih Amazon Bedrock sebagai layanan. Anda juga dapat merujuk ke tabel berikut:

Nama	Default	Dapat disesuaikan	Deskripsi
(Konsol) Ukuran file dokumen maksimum (MB)	Setiap Wilayah yang didukung: 200	Tidak	Tidak Ada Deskripsi Tersedia
(Konsol) Jumlah halaman maksimum per file dokumen	Setiap Wilayah yang didukung: 20	Tidak	Tidak Ada Deskripsi Tersedia
APIs per Agen	Setiap Wilayah yang didukung: 11	Ya	Jumlah maksimum APIs yang dapat Anda tambahkan ke Agen.
Kelompok aksi per Agen	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum grup aksi yang dapat Anda tambahkan ke Agen.
Agen Kolaborator untuk Agen	Setiap Wilayah yang didukung: 10	Ya	Jumlah maksimum agen kolaborator yang dapat Anda tambahkan ke Agen.
Node agen per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node agen.
Agen per akun	Setiap Wilayah yang didukung: 200	Ya	Jumlah maksimum Agen dalam satu akun.
AssociateAgentKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 6	Tidak	Jumlah maksimum permintaan AssociateAgentKnowledgeBase API per detik.
Alias terkait per Agen	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum alias yang dapat Anda kaitkan dengan Agen.
Basis pengetahuan terkait per Agen	Setiap Wilayah yang didukung: 2	Ya	Jumlah maksimum basis pengetahuan yang dapat Anda kaitkan dengan Agen.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Claude 3 Haiku.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Opus	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3 Opus.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3 Soneta	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3 Soneta.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Claude 3.5 Haiku.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3.5 Soneta.
Ukuran file input inferensi Batch (dalam GB) untuk Claude 3.5 Sonnet v2	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Claude 3.5 Soneta v2.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 405B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 70B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.1 8B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 11B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch Llama 3.2 1B Instruct.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 3B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.2 90B.
Ukuran file input inferensi Batch (dalam GB) untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Instruksi Llama 3.3 70B.
Ukuran file input inferensi Batch (dalam GB) untuk Mistral Large 2 (24,07)	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Mistral Large 2 (24,07).
Ukuran file input inferensi Batch (dalam GB) untuk Mistral Small	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Mistral Small.
Ukuran file input inferensi Batch (dalam GB) untuk Nova Lite V1	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Lite V1.
Ukuran file input inferensi Batch (dalam GB) untuk Nova Micro V1	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Micro V1.
Ukuran file input inferensi Batch (dalam GB) untuk Nova Pro V1	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) dikirimkan untuk inferensi batch untuk Nova Pro V1.
Ukuran file input inferensi Batch (dalam GB) untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Titan Multimodal Embeddings G1.
Ukuran file input inferensi Batch untuk Titan Text Embeddings V2 (dalam GB)	Setiap Wilayah yang didukung: 1	Tidak	Ukuran maksimum satu file (dalam GB) yang dikirimkan untuk inferensi batch untuk Titan Text Embeddings V2.
Ukuran pekerjaan inferensi batch (dalam GB) untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Haiku.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3 Opus	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Opus.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3 Soneta	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3 Soneta.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Claude 3.5 Sonnet v2	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Mistral Large 2 (24,07)	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07).
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Mistral Small	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Mistral Small.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Lite V1	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Lite V1.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Micro V1	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Micro V1.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Nova Pro V1	Setiap Wilayah yang didukung: 100	Tidak	Ukuran kumulatif maksimum semua file input (dalam GB) termasuk dalam pekerjaan inferensi batch untuk Nova Pro V1.
Ukuran pekerjaan inferensi Batch (dalam GB) untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1.
Ukuran pekerjaan inferensi Batch untuk Titan Text Embeddings V2 (dalam GB)	Setiap Wilayah yang didukung: 5	Tidak	Ukuran kumulatif maksimum dari semua file input (dalam GB) yang termasuk dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2.
Karakter dalam instruksi Agen	Setiap Wilayah yang didukung: 20.000	Tidak	Jumlah maksimum karakter dalam instruksi untuk Agen.
Node kolektor per aliran	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum node kolektor.
Pekerjaan konsumsi bersamaan per akun	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama di akun.
Pekerjaan konsumsi bersamaan per sumber data	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk sumber data.
Pekerjaan konsumsi bersamaan per basis pengetahuan	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk basis pengetahuan.
Pekerjaan impor model bersamaan	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum pekerjaan impor model yang sedang berlangsung secara bersamaan.
Kondisi node per aliran	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum node kondisi.
Kondisi per kondisi node	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum kondisi per node kondisi.
Panjang kueri pentanahan kontekstual dalam satuan teks	Setiap Wilayah yang didukung: 1	Tidak	Panjang maksimum, dalam satuan teks, dari kueri untuk landasan kontekstual
Panjang respons landasan kontekstual dalam satuan teks	Setiap Wilayah yang didukung: 5	Tidak	Panjang maksimum, dalam satuan teks, dari respons untuk landasan kontekstual
Panjang sumber landasan kontekstual dalam satuan teks	us-east-1:100 us-west-2:100 Masing-masing Wilayah yang didukung lainnya: 50	Tidak	Panjang maksimum, dalam satuan teks, dari sumber grounding untuk grounding kontekstual
CreateAgent permintaan per detik	Setiap Wilayah yang didukung: 6	Tidak	Jumlah maksimum permintaan CreateAgent API per detik.
CreateAgentActionGroup permintaan per detik	Setiap Wilayah yang didukung: 12	Tidak	Jumlah maksimum permintaan CreateAgentActionGroup API per detik.
CreateAgentAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan CreateAgentAlias API per detik.
CreateBlueprint - Jumlah cetak biru maksimum per akun	Setiap Wilayah yang didukung: 350	Ya	Tidak Ada Deskripsi Tersedia
CreateBlueprint - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
CreateBlueprintVersion - Jumlah maksimum versi Blueprint per Blueprint	Setiap Wilayah yang didukung: 10	Ya	Tidak Ada Deskripsi Tersedia
CreateBlueprintVersion - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
CreateDataSource permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan CreateDataSource API per detik.
CreateFlow permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum CreateFlow permintaan per detik.
CreateFlowAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum CreateFlowAlias permintaan per detik.
CreateFlowVersion permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum CreateFlowVersion permintaan per detik.
CreateKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan CreateKnowledgeBase API per detik.
CreatePrompt permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum CreatePrompt permintaan per detik.
CreatePromptVersion permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum CreatePromptVersion permintaan per detik.
InvokeModel Permintaan Lintas Wilayah per menit untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Permintaan Lintas Wilayah per menit untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Permintaan Lintas Wilayah per menit untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 200	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Permintaan Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku.
InvokeModel Permintaan Lintas Wilayah per menit untuk Anthropic Claude 3.5 Sonnet V2	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token Lintas Wilayah per menit untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 4.000.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token Lintas Wilayah per menit untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 4.000.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token Lintas Wilayah per menit untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 800.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku	Setiap Wilayah yang didukung: 4.000.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku.
InvokeModel Token Lintas Wilayah per menit untuk Anthropic Claude 3.5 Sonnet V2	Setiap Wilayah yang didukung: 800.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Sonnet V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan inferensi model lintas wilayah per menit untuk Anthropic Claude 3.7 Soneta V1	Setiap Wilayah yang didukung: 250	Tidak	Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Soneta V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan inferensi model lintas wilayah per menit untuk DeepSeek R1 V1	Setiap Wilayah yang didukung: 200	Tidak	Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk DeepSeek R1 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.3 70B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum permintaan lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Token inferensi model lintas wilayah per menit untuk Anthropic Claude 3.7 Soneta V1	Setiap Wilayah yang didukung: 1.000.000	Tidak	Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.7 Soneta V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Token inferensi model lintas wilayah per menit untuk DeepSeek R1 V1	Setiap Wilayah yang didukung: 200.000	Tidak	Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk DeepSeek R1 V1. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Token inferensi model lintas wilayah per menit untuk Instruksi Meta Llama 3.3 70B	Setiap Wilayah yang didukung: 600.000	Tidak	Jumlah maksimum token lintas wilayah yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Model khusus per akun	Setiap Wilayah yang didukung: 100	Ya	Jumlah maksimum model kustom dalam akun.
Sumber data per basis pengetahuan	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum sumber data per basis pengetahuan.
DeleteAgent permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteAgent API per detik.
DeleteAgentActionGroup permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteAgentActionGroup API per detik.
DeleteAgentAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteAgentAlias API per detik.
DeleteAgentVersion permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteAgentVersion API per detik.
DeleteBlueprint - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
DeleteDataSource permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteDataSource API per detik.
DeleteFlow permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum DeleteFlow permintaan per detik.
DeleteFlowAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum DeleteFlowAlias permintaan per detik.
DeleteFlowVersion permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum DeleteFlowVersion permintaan per detik.
DeleteKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan DeleteKnowledgeBase API per detik.
DeletePrompt permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum DeletePrompt permintaan per detik.
Panjang deskripsi untuk bidang (Karakter)	Setiap Wilayah yang didukung: 300	Tidak	Tidak Ada Deskripsi Tersedia
DisassociateAgentKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 4	Tidak	Jumlah maksimum permintaan DisassociateAgentKnowledgeBase API per detik.
Grup tindakan yang diaktifkan per agen	Setiap Wilayah yang didukung: 11	Ya	Jumlah maksimum grup tindakan yang dapat Anda aktifkan di Agen.
Titik akhir per profil inferensi	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum titik akhir dalam profil inferensi. Titik akhir didefinisikan oleh model dan wilayah tempat permintaan permintaan ke model dikirim.
Contoh frasa per Topik	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum contoh topik yang dapat dimasukkan per topik
File untuk ditambahkan atau diperbarui per pekerjaan konsumsi	Setiap Wilayah yang didukung: 5.000.000	Tidak	Jumlah maksimum file baru dan diperbarui yang dapat dicerna per pekerjaan konsumsi.
File yang akan dihapus per pekerjaan konsumsi	Setiap Wilayah yang didukung: 5.000.000	Tidak	Jumlah maksimum file yang dapat dihapus per pekerjaan konsumsi.
Alias aliran per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum alias aliran.
Versi aliran per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum versi aliran.
Arus per akun	Setiap Wilayah yang didukung: 100	Ya	Jumlah maksimum arus per akun.
GetAgent permintaan per detik	Setiap Wilayah yang didukung: 15	Tidak	Jumlah maksimum permintaan GetAgent API per detik.
GetAgentActionGroup permintaan per detik	Setiap Wilayah yang didukung: 20	Tidak	Jumlah maksimum permintaan GetAgentActionGroup API per detik.
GetAgentAlias permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan GetAgentAlias API per detik.
GetAgentKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 15	Tidak	Jumlah maksimum permintaan GetAgentKnowledgeBase API per detik.
GetAgentVersion permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan GetAgentVersion API per detik.
GetBlueprint - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
GetDataAutomationStatus - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
GetDataSource permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan GetDataSource API per detik.
GetFlow permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum GetFlow permintaan per detik.
GetFlowAlias permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum GetFlowAlias permintaan per detik.
GetFlowVersion permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum GetFlowVersion permintaan per detik.
GetIngestionJob permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan GetIngestionJob API per detik.
GetKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan GetKnowledgeBase API per detik.
GetPrompt permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum GetPrompt permintaan per detik.
Pagar pembatas per akun	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum pagar pembatas dalam akun
Model impor per akun	Setiap Wilayah yang didukung: 3	Ya	Jumlah maksimum model yang diimpor dalam akun.
Profil inferensi per akun	Setiap Wilayah yang didukung: 1.000	Ya	Jumlah maksimum profil inferensi dalam akun.
Ukuran file pekerjaan menelan	Setiap Wilayah yang didukung: 50	Tidak	Ukuran maksimum (dalam MB) file dalam pekerjaan konsumsi.
Ukuran pekerjaan konsumsi	Setiap Wilayah yang didukung: 100	Tidak	Ukuran maksimum (dalam GB) dari pekerjaan konsumsi.
Node masukan per aliran	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum node input aliran.
InvokeDataAutomationAsync - Audio - Jumlah maksimum pekerjaan bersamaan	Setiap Wilayah yang didukung: 20	Ya	Tidak Ada Deskripsi Tersedia
InvokeDataAutomationAsync - Dokumen - Jumlah maksimum pekerjaan bersamaan	Setiap Wilayah yang didukung: 25	Ya	Tidak Ada Deskripsi Tersedia
InvokeDataAutomationAsync - Gambar - Jumlah maksimum pekerjaan bersamaan	Setiap Wilayah yang didukung: 20	Ya	Tidak Ada Deskripsi Tersedia
InvokeDataAutomationAsync - Jumlah maksimum lowongan kerja	Setiap Wilayah yang didukung: 1.800	Tidak	Tidak Ada Deskripsi Tersedia
InvokeDataAutomationAsync - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
InvokeDataAutomationAsync - Video - Jumlah maksimum pekerjaan bersamaan	Setiap Wilayah yang didukung: 20	Ya	Tidak Ada Deskripsi Tersedia
Node iterator per aliran	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum node iterator.
Node dasar pengetahuan per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node basis pengetahuan.
Basis pengetahuan per akun	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum basis pengetahuan per akun.
Node fungsi Lambda per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node fungsi Lambda.
Lex node per aliran	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum node Lex.
ListAgentActionGroups permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListAgentActionGroups API per detik.
ListAgentAliases permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListAgentAliases API per detik.
ListAgentKnowledgeBases permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListAgentKnowledgeBases API per detik.
ListAgentVersions permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListAgentVersions API per detik.
ListAgents permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListAgents API per detik.
ListBlueprint - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
ListDataSources permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListDataSources API per detik.
ListFlowAliases permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum ListFlowAliases permintaan per detik.
ListFlowVersions permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum ListFlowVersions permintaan per detik.
ListFlows permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum ListFlows permintaan per detik.
ListIngestionJobs permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListIngestionJobs API per detik.
ListKnowledgeBases permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan ListKnowledgeBases API per detik.
ListPrompts permintaan per detik	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum ListPrompts permintaan per detik.
Tingkat Sampel Audio Maksimum (Hz)	Setiap Wilayah yang didukung: 48.000	Tidak	Tidak Ada Deskripsi Tersedia
Cetak Biru Maksimum per Proyek (Dokumen)	Setiap Wilayah yang didukung: 40	Tidak	Tidak Ada Deskripsi Tersedia
Cetak Biru Maksimum per Proyek (Gambar)	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
Ukuran Cetak Biru JSON Maksimum (Karakter)	Setiap Wilayah yang didukung: 100.000	Tidak	Tidak Ada Deskripsi Tersedia
Tingkat Maksimum Hierarki Lapangan	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
Jumlah maksimum halaman per dokumen	us-east-1:1.500 Masing-masing Wilayah yang didukung lainnya: 1.000	Tidak	Tidak Ada Deskripsi Tersedia
Resolusi Maksimum	Setiap Wilayah yang didukung: 8.000	Tidak	Tidak Ada Deskripsi Tersedia
Ukuran file audio maksimum (MB)	Setiap Wilayah yang didukung: 2,048	Tidak	Tidak Ada Deskripsi Tersedia
Panjang audio maksimum (Menit)	Setiap Wilayah yang didukung: 240	Tidak	Tidak Ada Deskripsi Tersedia
Ukuran file dokumen maksimum (MB)	Setiap Wilayah yang didukung: 500	Tidak	Tidak Ada Deskripsi Tersedia
Ukuran file gambar maksimal (MB)	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Ukuran file input maksimum untuk pekerjaan kustomisasi distilasi	Setiap Wilayah yang didukung: 2 Gigabytes	Tidak	Ukuran file input maksimum untuk pekerjaan kustomisasi distilasi.
Panjang baris maksimum untuk pekerjaan kustomisasi distilasi	Setiap Wilayah yang didukung: 16 Kilobyte	Tidak	Panjang baris maksimum dalam file input untuk pekerjaan kustomisasi distilasi.
Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Dokumen)	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
Jumlah maksimum Cetak Biru per permintaan Inferensi Mulai (Gambar)	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
Jumlah maksimum kolom daftar per Blueprint	Setiap Wilayah yang didukung: 15	Tidak	Tidak Ada Deskripsi Tersedia
Jumlah maksimum permintaan untuk pekerjaan kustomisasi distilasi	Setiap Wilayah yang didukung: 15.000	Tidak	Jumlah maksimum permintaan yang diperlukan untuk pekerjaan kustomisasi distilasi.
Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova Micro V1	Setiap Wilayah yang didukung: 32.000	Tidak	Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova Micro V1.
Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova V1	Setiap Wilayah yang didukung: 32.000	Tidak	Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Amazon Nova V1.
Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Anthropic Claude 3 haiku 20240307 V1	Setiap Wilayah yang didukung: 32.000	Tidak	Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Anthropic Claude 3 haiku 20240307 V1.
Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Llama 3.1 70B Instruct V1	Setiap Wilayah yang didukung: 16.000	Tidak	Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Llama 3.1 70B Instruct V1.
Panjang konteks fine tuning model siswa maksimum untuk Llama 3.1 8B Instruct V1 pekerjaan kustomisasi distilasi	Setiap Wilayah yang didukung: 32.000	Tidak	Panjang konteks fine tuning model siswa maksimum untuk pekerjaan kustomisasi distilasi Llama 3.1 8B Instruct V1.
Ukuran file video maksimal (MB)	Setiap Wilayah yang didukung: 10.240	Tidak	Tidak Ada Deskripsi Tersedia
Panjang video maksimum (Menit)	Setiap Wilayah yang didukung: 240	Tidak	Tidak Ada Deskripsi Tersedia
Tingkat Sampel Audio Minimum (Hz)	Setiap Wilayah yang didukung: 8.000	Tidak	Tidak Ada Deskripsi Tersedia
Panjang audio minimum (Milidetik)	Setiap Wilayah yang didukung: 500	Tidak	Tidak Ada Deskripsi Tersedia
Jumlah minimum permintaan untuk pekerjaan kustomisasi distilasi	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum permintaan yang diperlukan untuk pekerjaan kustomisasi distilasi.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Opus	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Opus.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3 Soneta	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Claude 3.5 Soneta v2	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Mistral Large 2 (24.07)	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07).
Jumlah minimum catatan per pekerjaan inferensi batch untuk Mistral Small	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Small.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Lite V1	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Lite V1.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Micro V1	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Micro V1.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Nova Pro V1	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Pro V1.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1.
Jumlah minimum catatan per pekerjaan inferensi batch untuk Titan Text Embeddings V2	Setiap Wilayah yang didukung: 100	Tidak	Jumlah minimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2.
Unit model tanpa komitmen Throughput yang disediakan di seluruh model dasar	Setiap Wilayah yang didukung: 2	Ya	Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model dasar
Unit model tanpa komitmen Throughput yang disediakan di seluruh model khusus	Setiap Wilayah yang didukung: 2	Ya	Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model kustom
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Mid	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Mid. AI21
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Ultra	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Ultra. AI21
Unit model per model yang disediakan untuk Amazon Nova Canvas	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Nova Canvas.
Unit model per model yang disediakan untuk Amazon Titan Embeddings G1 - Teks	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Embeddings G1 - Teks.
Unit model per model yang disediakan untuk Amazon Titan Image Generator G1	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G1.
Unit model per model yang disediakan untuk Amazon Titan Image Generator G2	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G2.
Unit model per model yang disediakan untuk Amazon Titan Lite V1 4K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Lite V1 4K.
Unit model per model yang disediakan untuk Amazon Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Multimodal Embeddings G1.
Unit model per model yang disediakan untuk Amazon Titan Text Embeddings V2	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Embeddings V2.
Unit model per model yang disediakan untuk Amazon Titan Text G1 - Express 8K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text G1 - Express 8K.
Unit model per model yang disediakan untuk Amazon Titan Text Premier V1 32K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Premier V1 32K.
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 200K.
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 48K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 48K.
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 200K.
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 28K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 28K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 16K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 16K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 200K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Haiku 64K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Haiku 64K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 18K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 18K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 200K.
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 51K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta V2 51K.
Unit model per model yang disediakan untuk Anthropic Claude Instant V1 100K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude Instant V1 100K.
Unit model per model yang disediakan untuk Anthropic Claude V2 100K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 100K.
Unit model per model yang disediakan untuk Anthropic Claude V2 18K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 18K.
Unit model per model yang disediakan untuk Anthropic Claude V2.1 18K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 18K.
Unit model per model yang disediakan untuk Anthropic Claude V2.1 200K	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 200k.
Unit model per model yang disediakan untuk Cohere Command	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command.
Unit model per model yang disediakan untuk Cohere Command Light	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command Light.
Unit model per model yang disediakan untuk Cohere Command R	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R 128k.
Unit model per model yang disediakan untuk Cohere Command R Plus	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R Plus 128k.
Unit model per model yang disediakan untuk Cohere Embed English	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed English.
Unit model per model yang disediakan untuk Cohere Embed Multilingual	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed Multilingual.
Unit model per model yang disediakan untuk DeepSeek R1 Distill Llama 3.3 70B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk DeepSeek R1 Distill Llama 3.3 70B.
Unit model per model yang disediakan untuk Meta Llama 2 13B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 13B.
Unit model per model yang disediakan untuk Meta Llama 2 70B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 70B.
Unit model per model yang disediakan untuk Meta Llama 2 Chat 13B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 13B.
Unit model per model yang disediakan untuk Meta Llama 2 Chat 70B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 70B.
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 70B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 70B Instruct.
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 8B	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 8B Instruct.
Unit model per model yang disediakan untuk Meta Llama 3.1 70B Instruct	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 70B Instruct.
Unit model per model yang disediakan untuk Meta Llama 3.1 8B Instruct	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 8B Instruct.
Unit model per model yang disediakan untuk Meta Llama 3.3 70B Instruct	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.3 70B Instruct.
Unit model per model yang disediakan untuk Mistral Large 2407	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Large 2407.
Unit model per model yang disediakan untuk Mistral Small	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Small.
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 0.8	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 0.8
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 1.0	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 1.0.
Unit model per model yang disediakan untuk varian panjang konteks 128k untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 128k untuk Amazon Nova Micro
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Lite
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Micro
Unit model per model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 24k untuk Amazon Nova Pro
Unit model per model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Lite
Unit model per model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 0	Ya	Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk varian panjang konteks 300k untuk Amazon Nova Pro.
Unit model tanpa komitmen untuk Provisioned Throughput dibuat untuk model dasar Amazon Nova Canvas V1.0	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk model dasar Amazon Nova Canvas V1.0, tanpa komitmen.
Unit model tanpa komitmen untuk Provisioned Throughput dibuat untuk model kustom Amazon Nova Canvas V1 0	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum unit model yang dapat dialokasikan ke Provisioned Throughput yang dibuat untuk model kustom Amazon Nova Canvas V1 0, tanpa komitmen.
Jumlah pekerjaan evaluasi model otomatis bersamaan	Setiap Wilayah yang didukung: 20	Tidak	Jumlah maksimum pekerjaan evaluasi model otomatis yang dapat Anda tentukan sekaligus di akun ini di Wilayah saat ini.
Jumlah pekerjaan evaluasi model bersamaan yang menggunakan pekerja manusia	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum pekerjaan evaluasi model yang menggunakan pekerja manusia dapat Anda tentukan pada satu waktu di akun ini di Wilayah saat ini.
Jumlah metrik kustom	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum metrik kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia.
Jumlah kumpulan data prompt khusus dalam pekerjaan evaluasi model berbasis manusia	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum kumpulan data prompt kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model berbasis manusia di akun ini di Wilayah saat ini.
Jumlah router prompt khusus per akun	Setiap Wilayah yang didukung: 500	Tidak	Jumlah maksimum router prompt khusus yang dapat Anda buat per akun per wilayah.
Jumlah dataset per pekerjaan	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum kumpulan data yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis. Ini termasuk kumpulan data prompt khusus dan bawaan.
Jumlah pekerjaan evaluasi	Setiap Wilayah yang didukung: 5.000	Tidak	Jumlah maksimum pekerjaan evaluasi model yang dapat Anda buat di akun ini di Wilayah saat ini.
Jumlah metrik per dataset	Setiap Wilayah yang didukung: 3	Tidak	Jumlah maksimum metrik yang dapat Anda tentukan per kumpulan data dalam pekerjaan evaluasi model otomatis. Ini termasuk metrik khusus dan bawaan.
Jumlah model dalam pekerjaan evaluasi model yang menggunakan pekerja manusia	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia.
Jumlah model dalam pekerjaan evaluasi model otomatis	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis.
Jumlah prompt dalam kumpulan data prompt kustom	Setiap Wilayah yang didukung: 1.000	Tidak	Jumlah maksimum permintaan yang dapat berisi kumpulan data prompt kustom.
Unit teks kebijakan filter ApplyGuardrail konten sesuai permintaan per detik	us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25	Ya	Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Konten per detik
Sesuai permintaan Unit teks kebijakan topik yang ApplyGuardrail ditolak per detik	us-east-1:50 us-west-2:50 Masing-masing Wilayah yang didukung lainnya: 25	Ya	Jumlah maksimum unit teks yang dapat diproses untuk kebijakan topik Ditolak per detik
Unit teks kebijakan filter informasi ApplyGuardrail sensitif sesuai permintaan per detik	us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25	Ya	Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter informasi sensitif per detik
Unit teks kebijakan filter ApplyGuardrail Word sesuai permintaan per detik	us-east-1:200 us-west-2:200 Masing-masing Wilayah yang didukung lainnya: 25	Ya	Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Word per detik.
Unit teks kebijakan ApplyGuardrail landasan kontekstual sesuai permintaan per detik	Setiap Wilayah yang didukung: 106	Ya	Jumlah maksimum unit teks yang dapat diproses untuk kebijakan grounding kontekstual per detik
Permintaan sesuai ApplyGuardrail permintaan per detik	us-east-1:50 us-west-2:50 Masing-masing Wilayah yang didukung lainnya: 25	Ya	Jumlah maksimum panggilan ApplyGuardrail API yang diizinkan per detik
Permintaan InvokeModel bersamaan sesuai permintaan untuk Amazon Nova Reel	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Amazon Nova Reel. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jamba 1.5 Large	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jamba 1.5 Mini	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi AI21 Labs Jamba	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jurassic-2 Mid	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk AI21 Labs Jurassic-2 Mid
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jurassic-2 Ultra	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk AI21 Labs Jurassic-2 Ultra
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Nova Canvas	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Canvas. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 1.000	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 1.000	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Rerank 1.0	Setiap Wilayah yang didukung: 200	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Rerank 1.0.
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Image Generator G1	Setiap Wilayah yang didukung: 60	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1.
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Image Generator G1 V2	Setiap Wilayah yang didukung: 60	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Amazon Titan Image Generator G V2.
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1.
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Embeddings	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Embeddings V2	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Express	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Express
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Lite	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Lite
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Premier	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Premier
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Haiku	us-east-1:1.000 us-west-2:1.000 ap-northeast-1:200 ap-southeast-1:200 Masing-masing Wilayah yang didukung lainnya: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Haiku.
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Opus	Setiap Wilayah yang didukung: 50	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude 3 Opus.
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Sonnet	us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude 3 Soneta.
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Haiku	us-west-1:400 Masing-masing Wilayah yang didukung lainnya: 1.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku.
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Sonnet	us-east-1:50 us-east-2:50 us-west-2:250 ap-northeast-2:50 ap-south-1:50 ap-southeast-2:50 Masing-masing Wilayah yang didukung lainnya: 20	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2	us-west-2:250 Masing-masing Wilayah yang didukung lainnya: 50	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude Instant	us-east-1:1.000 us-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude Instant
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude V2	us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude V2
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Komando Cohere.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command Light	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command Light.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command R	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command R 128k.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command R Plus	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command R Plus 128k.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Embed English	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed English.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Embed Multilingual	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed Multilingual.
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Rerank 3.5	Setiap Wilayah yang didukung: 250	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Cohere Rerank 3.5.
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 13B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 13B.
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 70B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 70B.
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 Chat 13B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 Chat 13B.
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 Chat 70B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 Chat 70B.
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Meta Llama 3 70B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 3 70B Instruct.
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Meta Llama 3 8B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 3 8B Instruct.
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Mistral 7B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mistral-7 0 b-instruct-v
Permintaan sesuai InvokeModel permintaan per menit untuk Mistral AI Mistral Small	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral AI Mistral Small
Permintaan sesuai InvokeModel permintaan per menit untuk Mistral Large	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral mistral-large 2402-v1
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Mistral Mixtral 8x7b	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mixtral-8x7b-v0
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion 3 Large	Setiap Wilayah yang didukung: 15	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Large.
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion 3 Medium	Setiap Wilayah yang didukung: 60	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Medium
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion 3.5 Large	Setiap Wilayah yang didukung: 15	Tidak	Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream untuk Stability.ai Stable Diffusion 3.5 Large.
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion XL 0.8	Setiap Wilayah yang didukung: 60	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 0.8
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion XL 1.0	Setiap Wilayah yang didukung: 60	Tidak	Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 1.0
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Image Core	Setiap Wilayah yang didukung: 90	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Core.
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Image Ultra	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Ultra.
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Large	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan. InvokeModel
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Mini	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan. InvokeModel
InvokeModel Token sesuai permintaan per menit untuk Instruksi AI21 Labs Jamba	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi AI21 Labs Jamba. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan InvokeModel
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Mid	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Mid.
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Ultra	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Ultra.
InvokeModel Token sesuai permintaan per menit untuk Amazon Nova Lite	Setiap Wilayah yang didukung: 2.000.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Lite. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token sesuai permintaan per menit untuk Amazon Nova Micro	Setiap Wilayah yang didukung: 2.000.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Micro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token sesuai permintaan per menit untuk Amazon Nova Pro	Setiap Wilayah yang didukung: 400.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Amazon Nova Pro. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Image Generator G1	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Image Generator G1 V2	Setiap Wilayah yang didukung: 2.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1 V2.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Embeddings	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Embeddings V2	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Express	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Express.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Lite	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Lite.
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Premier	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Premier.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Haiku	us-east-1:2.000.000 us-west-2:2.000.000 ap-northeast-1:200.000 ap-southeast-1:200.000 Masing-masing Wilayah yang didukung lainnya: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Haiku.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Opus	Setiap Wilayah yang didukung: 400.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Opus.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Sonnet	us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Daerah yang didukung lainnya: 200.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Soneta.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku	us-west-1:300.000 Masing-masing Wilayah yang didukung lainnya: 2.000.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet	us-east-1:400.000 us-east-2:400.000 us-west-2:2.000.000 ap-northeast-2:400.000 ap-south-1:400.000 ap-southeast-2:400.000 Masing-masing Daerah yang didukung lainnya: 200.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2	us-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 400.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Sonnet V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude Instant	us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Wilayah yang didukung lainnya: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude Instant.
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude V2	us-east-1:500.000 us-west-2:500.000 Masing-masing Daerah yang didukung lainnya: 200.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude V2.
InvokeModel Token sesuai permintaan per menit untuk Cohere Command	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command.
InvokeModel Token sesuai permintaan per menit untuk Cohere Command Light	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Command Light.
InvokeModel Token sesuai permintaan per menit untuk Cohere Command R	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command R 128k.
InvokeModel Token sesuai permintaan per menit untuk Cohere Command R Plus	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command R Plus 128k.
InvokeModel Token sesuai permintaan per menit untuk Cohere Embed English	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed English.
InvokeModel Token sesuai permintaan per menit untuk Cohere Embed Multilingual	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed Multilingual.
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 13B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 13B.
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 70B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 70B.
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 Chat 13B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 Chat 13B.
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 Chat 70B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 Chat 70B.
InvokeModel Token sesuai permintaan per menit untuk Instruksi Meta Llama 3 70B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 3 70B Instruct.
InvokeModel Token sesuai permintaan per menit untuk Instruksi Meta Llama 3 8B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 3 8B Instruct.
InvokeModel Token sesuai permintaan per menit untuk Instruksi Mistral AI Mistral 7B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral 7B Instruct.
InvokeModel Token sesuai permintaan per menit untuk Mistral AI Mistral Large	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral Large.
InvokeModel Token sesuai permintaan per menit untuk Mistral AI Mistral Small	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral Small.
InvokeModel Token sesuai permintaan per menit untuk Instruksi Mistral AI Mixtral 8X7BB	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral mixtral-8x7 0. b-instruct-v
Permintaan yang dioptimalkan latensi sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Haiku	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku, jika optimasi latensi dikonfigurasi.
InvokeModel Token yang dioptimalkan latensi sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku	Setiap Wilayah yang didukung: 500.000	Tidak	Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku, jika optimasi latensi dikonfigurasi.
Permintaan inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct, jika optimasi latensi dikonfigurasi. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B	Setiap Wilayah yang didukung: 100	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct, jika optimasi latensi dikonfigurasi. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B	Setiap Wilayah yang didukung: 40.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct, jika optimasi latensi dikonfigurasi. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model yang dioptimalkan latensi sesuai permintaan per menit untuk Meta Llama 3.1 70b Instruct	Setiap Wilayah yang didukung: 40.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70b Instruct, jika optimasi latensi dikonfigurasi. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan bersamaan inferensi model sesuai permintaan untuk Luma Ray V2	Setiap Wilayah yang didukung: 1	Tidak	Jumlah maksimum permintaan bersamaan yang dapat Anda kirimkan untuk inferensi model untuk Luma Ray V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B	Setiap Wilayah yang didukung: 200	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 1B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B	Setiap Wilayah yang didukung: 800	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.3 70B	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum permintaan sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi Meta Llama 3.3 70B. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Permintaan inferensi model sesuai permintaan per menit untuk Mistral Large 2407	Setiap Wilayah yang didukung: 400	Tidak	Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 1B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.3 70B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token sesuai permintaan yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.3 70B Instruct. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream
Token inferensi model sesuai permintaan per menit untuk Mistral Large 2407	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B	Setiap Wilayah yang didukung: 400.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B	Setiap Wilayah yang didukung: 300.000	Tidak	Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream
Node keluaran per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node output aliran.
Parameter per fungsi	Setiap Wilayah yang didukung: 5	Ya	Jumlah maksimum parameter yang dapat Anda miliki dalam fungsi grup tindakan.
PrepareAgent permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan PrepareAgent API per detik.
PrepareFlow permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum PrepareFlow permintaan per detik.
Node prompt per aliran	Setiap Wilayah yang didukung: 10	Ya	Jumlah maksimum node prompt.
Permintaan per akun	Setiap Wilayah yang didukung: 50	Ya	Jumlah maksimum petunjuk.
Catatan pekerjaan inferensi per batch untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku.
Catatan pekerjaan inferensi per batch untuk Claude 3 Opus	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Opus.
Catatan pekerjaan inferensi per batch untuk Claude 3 Sonnet	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta.
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku.
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta.
Catatan pekerjaan inferensi per batch untuk Claude 3.5 Sonnet v2	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B.
Catatan pekerjaan inferensi per batch untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B.
Catatan pekerjaan inferensi per batch untuk Mistral Large 2 (24.07)	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24.07).
Catatan pekerjaan inferensi per batch untuk Mistral Small	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Mistral Small.
Rekaman pekerjaan inferensi per batch untuk Nova Lite V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Lite V1.
Catatan pekerjaan inferensi per batch untuk Nova Micro V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Micro V1.
Rekaman pekerjaan inferensi per batch untuk Nova Pro V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Nova Pro V1.
Catatan pekerjaan inferensi per batch untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1.
Catatan pekerjaan inferensi per batch untuk Titan Text Embeddings V2	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2.
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Haiku.
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Opus	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Opus.
Catatan per file input per pekerjaan inferensi batch untuk Claude 3 Soneta	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3 Soneta.
Catatan per file input per pekerjaan inferensi batch untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Haiku.
Catatan per file input per pekerjaan inferensi batch untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta.
Rekaman per file input per pekerjaan inferensi batch untuk Claude 3.5 Sonnet v2	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Claude 3.5 Soneta v2.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 405B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 70B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.1 8B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 11B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch Llama 3.2 1B Instruct.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 3B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.2 90B.
Catatan per file input per pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Instruksi Llama 3.3 70B.
Catatan per file input per pekerjaan inferensi batch untuk Mistral Large 2 (24.07)	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Mistral Large 2 (24,07).
Catatan per file input per pekerjaan inferensi batch untuk Mistral Small	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Mistral Small.
Rekaman per file input per pekerjaan inferensi batch untuk Nova Lite V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Lite V1.
Catatan per file input per pekerjaan inferensi batch untuk Nova Micro V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Micro V1.
Rekaman per file input per pekerjaan inferensi batch untuk Nova Pro V1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Nova Pro V1.
Catatan per file input per pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Titan Multimodal Embeddings G1.
Catatan per file input per pekerjaan inferensi batch untuk Titan Text Embeddings V2	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch untuk Titan Text Embeddings V2.
Entitas regex di Filter Informasi Sensitif	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum regex filter pagar pembatas yang dapat dimasukkan dalam kebijakan informasi sensitif
Panjang regex dalam karakter	Setiap Wilayah yang didukung: 500	Tidak	Panjang maksimum, dalam karakter, dari filter pagar pembatas regex
Ambil permintaan per detik	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum permintaan Retrieve API per detik.
RetrieveAndGenerate permintaan per detik	Setiap Wilayah yang didukung: 5	Tidak	Jumlah maksimum permintaan RetrieveAndGenerate API per detik.
Node pengambilan S3 per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node pengambilan S3.
Node penyimpanan S3 per aliran	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum node penyimpanan S3.
Pekerjaan kustomisasi terjadwal	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum pekerjaan kustomisasi terjadwal.
Ukuran prompt	Setiap Wilayah yang didukung: 4	Tidak	Ukuran maksimum (dalam KB) dari prompt individu dalam kumpulan data prompt khusus.
StartIngestionJob permintaan per detik	Setiap Wilayah yang didukung: 0.1	Tidak	Jumlah maksimum permintaan StartIngestionJob API per detik.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Haiku	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Haiku.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Opus	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Opus.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Soneta	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3 Soneta.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Haiku	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Haiku.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta v2	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Claude 3.5 Soneta v2.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 405B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 405B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 70B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 70B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 8B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.1 8B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 11B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 11B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 1B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 1B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 3B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 3B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 90B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.2 90B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.3 70B	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Instruksi Llama 3.3 70B.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Large 2 (24.07)	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Large 2 (24.07).
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Small	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Mistral Small.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Lite V1	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Lite V1.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Micro V1	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Micro V1.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Pro V1	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Nova Pro V1.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Multimodal Embeddings G1.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Text Embeddings V2	Setiap Wilayah yang didukung: 20	Ya	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar untuk Titan Text Embeddings V2.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Multimodal Embeddings G1	Setiap Wilayah yang didukung: 3	Tidak	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Multimodal Embeddings G1.
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Text Embeddings V2	Setiap Wilayah yang didukung: 3	Tidak	Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus untuk Titan Text Embeddings V2
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Lite	Setiap Wilayah yang didukung: 20.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Lite.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Micro	Setiap Wilayah yang didukung: 20.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Micro.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Amazon Nova Pro	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Amazon Nova Pro.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Claude 3 Haiku v1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Claude 3 Haiku.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 13B v1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 13B.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 70B v1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 70B.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 70B Instruct v1 Fine-tuning	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 70B Instruct Fine-tuning.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 8B Instruct v1 Fine-tuning	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 8B Instruct Fine-tuning.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Generator Gambar Titan.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V2	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Fine-tuning Titan Image Generator V2.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Multimodal Embeddings G1 v1	Setiap Wilayah yang didukung: 50.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Multimodal Embeddings.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Titan Text G1 - Express v1 Lanjutan Pra-Pelatihan	Setiap Wilayah yang didukung: 100.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Express.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Express v1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Express.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Titan Text G1 - Lite v1 Lanjutan Pra-Pelatihan	Setiap Wilayah yang didukung: 100.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Lite.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Lite v1	Setiap Wilayah yang didukung: 10.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Lite.
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Premier v1	Setiap Wilayah yang didukung: 20.000	Ya	Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Premier.
Waktu tugas untuk pekerja	Setiap Wilayah yang didukung: 30	Tidak	Panjang maksimum (dalam hari) waktu yang dimiliki seorang pekerja untuk menyelesaikan tugas.
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: ListTagsForResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Runtime Otomasi Data Batuan Dasar: ListTagsForResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: TagResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Runtime Otomasi Data Batuan Dasar: TagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk Runtime Otomasi Data Batuan Dasar: UntagResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Runtime Otomasi Data Batuan Dasar: UntagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk Otomasi Data Batuan Dasar: ListTagsForResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Otomasi Data Batuan Dasar: ListTagsForResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk Otomasi Data Batuan Dasar: TagResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Otomasi Data Batuan Dasar: TagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk Otomasi Data Batuan Dasar: UntagResource	Setiap Wilayah yang didukung: 25	Tidak	Jumlah maksimum Otomasi Data Batuan Dasar: UntagResource permintaan yang dapat Anda buat per detik per akun, di wilayah saat ini
Batas laju throttle untuk CreateBlueprint	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk CreateBlueprintVersion	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk CreateDataAutomationProject	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk DeleteBlueprint	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk DeleteDataAutomationProject	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk GetBlueprint	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk GetDataAutomationProject	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk GetDataAutomationStatus	Setiap Wilayah yang didukung: 10	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk InvokeDataAutomationAsync	Setiap Wilayah yang didukung: 10	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk ListBlueprints	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk ListDataAutomationProjects	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk UpdateBlueprint	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Batas laju throttle untuk UpdateDataAutomationProject	Setiap Wilayah yang didukung: 5	Tidak	Tidak Ada Deskripsi Tersedia
Topik per pagar pembatas	Setiap Wilayah yang didukung: 30	Tidak	Jumlah maksimum topik yang dapat didefinisikan di seluruh kebijakan topik pagar pembatas
Total node per aliran	Setiap Wilayah yang didukung: 40	Tidak	Jumlah maksimum node dalam aliran.
UpdateAgent permintaan per detik	Setiap Wilayah yang didukung: 4	Tidak	Jumlah maksimum permintaan UpdateAgent API per detik.
UpdateAgentActionGroup permintaan per detik	Setiap Wilayah yang didukung: 6	Tidak	Jumlah maksimum permintaan UpdateAgentActionGroup API per detik
UpdateAgentAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan UpdateAgentAlias API per detik.
UpdateAgentKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 4	Tidak	Jumlah maksimum permintaan UpdateAgentKnowledgeBase API per detik.
UpdateBlueprint - Batas throttle dalam transaksi per detik	Setiap Wilayah yang didukung: 1	Tidak	Tidak Ada Deskripsi Tersedia
UpdateDataSource permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan UpdateDataSource API per detik.
UpdateFlow permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum UpdateFlow permintaan per detik.
UpdateFlowAlias permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum UpdateFlowAlias permintaan per detik.
UpdateKnowledgeBase permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum permintaan UpdateKnowledgeBase API per detik.
UpdatePrompt permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum UpdatePrompt permintaan per detik.
Ukuran kueri pengguna	Setiap Wilayah yang didukung: 1.000	Tidak	Ukuran maksimum (dalam karakter) dari kueri pengguna.
ValidateFlowDefinition permintaan per detik	Setiap Wilayah yang didukung: 2	Tidak	Jumlah maksimum ValidateFlowDefinition permintaan per detik.
Versi per pagar pembatas	Setiap Wilayah yang didukung: 20	Tidak	Jumlah maksimum versi yang dapat dimiliki pagar pembatas
Versi per prompt	Setiap Wilayah yang didukung: 10	Tidak	Jumlah maksimum versi per prompt.
Panjang kata dalam karakter	Setiap Wilayah yang didukung: 100	Tidak	Panjang maksimum kata, dalam karakter, dalam daftar kata yang diblokir
Kebijakan kata per kata	Setiap Wilayah yang didukung: 10.000	Tidak	Jumlah maksimum kata yang dapat dimasukkan dalam daftar kata yang diblokir