Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Titik akhir dan kuota Amazon Bedrock
Berikut ini adalah titik akhir layanan dan kuota layanan untuk layanan ini. Untuk terhubung secara terprogram ke AWS layanan, Anda menggunakan titik akhir. Selain AWS titik akhir standar, beberapa AWS layanan menawarkan FIPS titik akhir di Wilayah tertentu. Untuk informasi selengkapnya, lihat AWS titik akhir layanan. Kuota layanan, juga disebut sebagai batas, adalah jumlah maksimum sumber daya layanan atau operasi untuk AWS akun Anda. Untuk informasi selengkapnya, lihat AWS kuota layanan.
Titik akhir layanan
Pesawat kontrol Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk mengelola, melatih, dan menerapkan model. Gunakan titik akhir ini untuk operasi Amazon Bedrock API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
AS Timur (Ohio) | us-east-2 |
bedrock.us-east-2.amazonaws.com bedrock-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
AS Timur (Virginia Utara) | us-east-1 |
bedrock.us-east-1.amazonaws.com bedrock-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
US West (Oregon) | us-west-2 |
bedrock.us-west-2.amazonaws.com bedrock-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock.ap-south-1.amazonaws.com | HTTPS |
Asia Pasifik (Seoul) | ap-northeast-2 | bedrock.ap-northeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pacific (Tokyo) | ap-northeast-1 | bedrock.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 |
bedrock.ca-central-1.amazonaws.com bedrock-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock.eu-central-1.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock.eu-west-2.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock.eu-west-3.amazonaws.com | HTTPS |
Eropa (Zürich) | eu-central-2 | bedrock.eu-central-2.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock.sa-east-1.amazonaws.com | HTTPS |
AWS GovCloud (AS-Timur) | us-gov-east-1 |
bedrock.us-gov-east-1.amazonaws.com bedrock-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
AWS GovCloud (AS-Barat) | us-gov-west-1 |
bedrock.us-gov-west-1.amazonaws.com bedrock-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Waktu proses Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Amazon Bedrock untuk membuat permintaan inferensi untuk model yang dihosting di Amazon Bedrock. Gunakan titik akhir ini untuk operasi Amazon Bedrock Runtime API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
AS Timur (Ohio) | us-east-2 |
bedrock-runtime.us-east-2.amazonaws.com bedrock-runtime-fips.us-east-2.amazonaws.com |
HTTPS HTTPS |
AS Timur (Virginia Utara) | us-east-1 |
bedrock-runtime.us-east-1.amazonaws.com bedrock-runtime-fips.us-east-1.amazonaws.com |
HTTPS HTTPS |
US West (Oregon) | us-west-2 |
bedrock-runtime.us-west-2.amazonaws.com bedrock-runtime-fips.us-west-2.amazonaws.com |
HTTPS HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock-runtime.ap-south-1.amazonaws.com | HTTPS |
Asia Pasifik (Seoul) | ap-northeast-2 | bedrock-runtime.ap-northeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock-runtime.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pacific (Sydney) | ap-southeast-2 | bedrock-runtime.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pacific (Tokyo) | ap-northeast-1 | bedrock-runtime.ap-northeast-1.amazonaws.com | HTTPS |
Canada (Central) | ca-central-1 |
bedrock-runtime.ca-central-1.amazonaws.com bedrock-runtime-fips.ca-central-1.amazonaws.com |
HTTPS HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock-runtime.eu-central-1.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock-runtime.eu-west-1.amazonaws.com | HTTPS |
Europe (London) | eu-west-2 | bedrock-runtime.eu-west-2.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock-runtime.eu-west-3.amazonaws.com | HTTPS |
Eropa (Zürich) | eu-central-2 | bedrock-runtime.eu-central-2.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock-runtime.sa-east-1.amazonaws.com | HTTPS |
AWS GovCloud (AS-Timur) | us-gov-east-1 |
bedrock-runtime.us-gov-east-1.amazonaws.com bedrock-runtime-fips.us-gov-east-1.amazonaws.com |
HTTPS HTTPS |
AWS GovCloud (AS-Barat) | us-gov-west-1 |
bedrock-runtime.us-gov-west-1.amazonaws.com bedrock-runtime-fips.us-gov-west-1.amazonaws.com |
HTTPS HTTPS |
Agen untuk waktu pembuatan Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk membuat dan mengelola agen dan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Amazon Bedrock API.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
US East (N. Virginia) | us-east-1 | bedrock-agent.us-east-1.amazonaws.com | HTTPS |
bedrock-agent-fips.us-east-1.amazonaws.com | HTTPS | ||
AS Barat (Oregon) | us-west-2 | bedrock-agent.us-west-2.amazonaws.com | HTTPS |
bedrock-agent-fips.us-west-2.amazonaws.com | HTTPS | ||
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock-agent.ap-southeast-1.amazonaws.com | HTTPS |
Asia Pasifik (Sydney) | ap-southeast-2 | bedrock-agent.ap-southeast-2.amazonaws.com | HTTPS |
Asia Pasifik (Tokyo) | ap-northeast-1 | bedrock-agent.ap-northeast-1.amazonaws.com | HTTPS |
Kanada (Pusat) | ca-central-1 | bedrock-agent.ca-central-1.amazonaws.com | HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock-agent.eu-central-1.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock-agent.eu-west-1.amazonaws.com | HTTPS |
Eropa (London) | eu-west-2 | bedrock-agent.eu-west-2.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock-agent.eu-west-3.amazonaws.com | HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock-agent.ap-south-1.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock-agent.sa-east-1.amazonaws.com | HTTPS |
Agen untuk runtime Amazon Bedrock APIs
Tabel berikut menyediakan daftar titik akhir khusus Wilayah yang didukung Agen untuk Amazon Bedrock untuk memanggil agen dan menanyakan basis pengetahuan. Gunakan titik akhir ini untuk Agen untuk operasi Runtime API Amazon Bedrock.
Nama Wilayah | Wilayah | Titik Akhir | Protokol |
---|---|---|---|
US East (N. Virginia) | us-east-1 | bedrock-agent-runtime.us-east-1.amazonaws.com | HTTPS |
bedrock-agent-runtime-fips.us-east-1.amazonaws.com | HTTPS | ||
AS Barat (Oregon) | us-west-2 | bedrock-agent-runtime.us-west-2.amazonaws.com | HTTPS |
bedrock-agent-runtime-fips.us-west-2.amazonaws.com | HTTPS | ||
Asia Pasifik (Singapura) | ap-southeast-1 | bedrock-agent-runtime.ap-tenggara 1.amazonaws.com | HTTPS |
Asia Pasifik (Sydney) | ap-southeast-2 | bedrock-agent-runtime.ap-tenggara 2.amazonaws.com | HTTPS |
Asia Pasifik (Tokyo) | ap-northeast-1 | bedrock-agent-runtime.ap-northeast-1.amazonaws.com | HTTPS |
Kanada (Pusat) | ca-central-1 | bedrock-agent-runtime.ca-central-1.amazonaws.com | HTTPS |
Eropa (Frankfurt) | eu-central-1 | bedrock-agent-runtime.eu-central-1.amazonaws.com | HTTPS |
Eropa (Paris) | eu-west-3 | bedrock-agent-runtime.eu-west-3.amazonaws.com | HTTPS |
Eropa (Irlandia) | eu-west-1 | bedrock-agent-runtime.eu-west-1.amazonaws.com | HTTPS |
Eropa (London) | eu-west-2 | bedrock-agent-runtime.eu-west-2.amazonaws.com | HTTPS |
Asia Pasifik (Mumbai) | ap-south-1 | bedrock-agent-runtime.ap-selatan-1.amazonaws.com | HTTPS |
Amerika Selatan (Sao Paulo) | sa-east-1 | bedrock-agent-runtime.sa-timur-1.amazonaws.com | HTTPS |
Kuota layanan
Untuk petunjuk tentang cara meminta peningkatan kuota, baik untuk kuota yang nilai Adjustable ditandai sebagai Ya dan yang ditandai sebagai Tidak, lihat Meminta peningkatan untuk kuota Amazon Bedrock. Tabel berikut menunjukkan daftar kuota untuk Amazon Bedrock:
Nama | Default | Dapat disesuaikan | Deskripsi |
---|---|---|---|
APIsper Agen | Setiap Wilayah yang didukung: 11 | Ya |
Jumlah maksimum APIs yang dapat Anda tambahkan ke Agen. |
Kelompok aksi per Agen | Setiap Wilayah yang didukung: 20 | Ya |
Jumlah maksimum grup aksi yang dapat Anda tambahkan ke Agen. |
Node agen per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node agen. |
Agen per akun |
ca-central-1:200 eu-central-1:200 Masing-masing Wilayah yang didukung lainnya: 50 |
Ya |
Jumlah maksimum Agen dalam satu akun. |
AssociateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum AssociateAgentKnowledgeBase API permintaan per detik. |
Alias terkait per Agen | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum alias yang dapat Anda kaitkan dengan Agen. |
Basis pengetahuan terkait per Agen | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum basis pengetahuan yang dapat Anda kaitkan dengan Agen. |
Ukuran file masukan inferensi Batch | Setiap Wilayah yang didukung: 1,073.741,824 | Ya |
Ukuran maksimum satu file (dalam byte) yang dikirimkan untuk inferensi batch. |
Ukuran pekerjaan inferensi Batch | Setiap Wilayah yang didukung: 5.368.709.120 | Ya |
Ukuran kumulatif maksimum dari semua file input (dalam byte) termasuk dalam pekerjaan inferensi batch. |
Karakter dalam instruksi Agen | Setiap Wilayah yang didukung: 8.000 | Ya |
Jumlah maksimum karakter dalam instruksi untuk Agen. |
Node kolektor per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node kolektor. |
Pekerjaan konsumsi bersamaan per akun | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama di akun. |
Pekerjaan konsumsi bersamaan per sumber data | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk sumber data. |
Pekerjaan konsumsi bersamaan per basis pengetahuan | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan konsumsi yang dapat berjalan pada saat yang sama untuk basis pengetahuan. |
Pekerjaan impor model bersamaan | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum pekerjaan impor model yang sedang berlangsung secara bersamaan. |
Kondisi node per aliran | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum node kondisi. |
Kondisi per kondisi node | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum kondisi per node kondisi. |
Panjang kueri grounding kontekstual dalam satuan teks | Setiap Wilayah yang didukung: 1 | Tidak | Panjang maksimum, dalam satuan teks, dari kueri untuk landasan kontekstual |
Panjang respons landasan kontekstual dalam satuan teks | Setiap Wilayah yang didukung: 5 | Tidak | Panjang maksimum, dalam satuan teks, dari respons untuk landasan kontekstual |
Panjang sumber landasan kontekstual dalam satuan teks |
us-east-1:100 us-west-2:100 Masing-masing Wilayah yang didukung lainnya: 50 |
Tidak | Panjang maksimum, dalam satuan teks, dari sumber grounding untuk grounding kontekstual |
CreateAgent permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum CreateAgent API permintaan per detik. |
CreateAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 12 | Tidak | Jumlah maksimum CreateAgentActionGroup API permintaan per detik. |
CreateAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateAgentAlias API permintaan per detik. |
CreateDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateDataSource API permintaan per detik. |
CreateFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlow permintaan per detik. |
CreateFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlowAlias permintaan per detik. |
CreateFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateFlowVersion permintaan per detik. |
CreateKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreateKnowledgeBase API permintaan per detik. |
CreatePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreatePrompt permintaan per detik. |
CreatePromptVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum CreatePromptVersion permintaan per detik. |
InvokeModel Permintaan Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku. |
InvokeModel Token Lintas Wilayah per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 4.000.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku. |
Model khusus per akun | Setiap Wilayah yang didukung: 100 | Ya |
Jumlah maksimum model kustom dalam akun. |
Sumber data per basis pengetahuan | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum sumber data per basis pengetahuan. |
DeleteAgent permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteAgent API permintaan per detik. |
DeleteAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteAgentActionGroup API permintaan per detik. |
DeleteAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteAgentAlias API permintaan per detik. |
DeleteAgentVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteAgentVersion API permintaan per detik. |
DeleteDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteDataSource API permintaan per detik. |
DeleteFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlow permintaan per detik. |
DeleteFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlowAlias permintaan per detik. |
DeleteFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteFlowVersion permintaan per detik. |
DeleteKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeleteKnowledgeBase API permintaan per detik. |
DeletePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum DeletePrompt permintaan per detik. |
DisassociateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum DisassociateAgentKnowledgeBase API permintaan per detik. |
Grup tindakan yang diaktifkan per agen | Setiap Wilayah yang didukung: 11 | Ya |
Jumlah maksimum grup tindakan yang dapat Anda aktifkan di Agen. |
Titik akhir per profil inferensi | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum titik akhir dalam profil inferensi. Titik akhir didefinisikan oleh model dan wilayah tempat permintaan permintaan ke model dikirim. |
Contoh frasa per Topik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum contoh topik yang dapat dimasukkan per topik |
File untuk ditambahkan atau diperbarui per pekerjaan konsumsi | Setiap Wilayah yang didukung: 5.000.000 | Tidak | Jumlah maksimum file baru dan yang diperbarui yang dapat dicerna per pekerjaan konsumsi. |
File yang akan dihapus per pekerjaan konsumsi | Setiap Wilayah yang didukung: 5.000.000 | Tidak | Jumlah maksimum file yang dapat dihapus per pekerjaan konsumsi. |
Alias aliran per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum alias aliran. |
Versi aliran per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum versi aliran. |
Arus per akun | Setiap Wilayah yang didukung: 100 | Ya |
Jumlah maksimum arus per akun. |
GetAgent permintaan per detik | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum GetAgent API permintaan per detik. |
GetAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum GetAgentActionGroup API permintaan per detik. |
GetAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetAgentAlias API permintaan per detik. |
GetAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum GetAgentKnowledgeBase API permintaan per detik. |
GetAgentVersion permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetAgentVersion API permintaan per detik. |
GetDataSource permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetDataSource API permintaan per detik. |
GetFlow permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlow permintaan per detik. |
GetFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlowAlias permintaan per detik. |
GetFlowVersion permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetFlowVersion permintaan per detik. |
GetIngestionJob permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetIngestionJob API permintaan per detik. |
GetKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetKnowledgeBase API permintaan per detik. |
GetPrompt permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum GetPrompt permintaan per detik. |
Pagar pembatas per akun | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum pagar pembatas dalam akun |
Model impor per akun | Setiap Wilayah yang didukung: 3 | Ya |
Jumlah maksimum model yang diimpor dalam akun. |
Profil inferensi per akun | Setiap Wilayah yang didukung: 1.000 | Ya |
Jumlah maksimum profil inferensi dalam akun. |
Ukuran file pekerjaan menelan | Setiap Wilayah yang didukung: 50 | Tidak | Ukuran maksimum (dalam MB) file dalam pekerjaan konsumsi. |
Ukuran pekerjaan konsumsi | Setiap Wilayah yang didukung: 100 | Tidak | Ukuran maksimum (dalam GB) dari pekerjaan konsumsi. |
Node masukan per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node input aliran. |
Node iterator per aliran | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum node iterator. |
Node dasar pengetahuan per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node basis pengetahuan. |
Basis pengetahuan per akun | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum basis pengetahuan per akun. |
Node fungsi Lambda per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node fungsi Lambda. |
Lex node per aliran | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum node Lex. |
ListAgentActionGroups permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListAgentActionGroups API permintaan per detik. |
ListAgentAliases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListAgentAliases API permintaan per detik. |
ListAgentKnowledgeBases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListAgentKnowledgeBases API permintaan per detik. |
ListAgentVersions permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListAgentVersions API permintaan per detik. |
ListAgents permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListAgents API permintaan per detik. |
ListDataSources permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListDataSources API permintaan per detik. |
ListFlowAliases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlowAliases permintaan per detik. |
ListFlowVersions permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlowVersions permintaan per detik. |
ListFlows permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListFlows permintaan per detik. |
ListIngestionJobs permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListIngestionJobs API permintaan per detik. |
ListKnowledgeBases permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListKnowledgeBases API permintaan per detik. |
ListPrompts permintaan per detik | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum ListPrompts permintaan per detik. |
Unit model tanpa komitmen Throughput yang disediakan di seluruh model dasar | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model dasar |
Unit model tanpa komitmen Throughput yang disediakan di seluruh model kustom | Setiap Wilayah yang didukung: 2 | Ya |
Jumlah maksimum unit model yang dapat didistribusikan di seluruh Throughput yang Disediakan tanpa komitmen untuk model kustom |
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Mid. AI21 |
Unit model per model yang disediakan untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Labs Jurassic-2 Ultra. AI21 |
Unit model per model yang disediakan untuk Amazon Titan Embeddings G1 - Teks | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Embeddings G1 - Teks. |
Unit model per model yang disediakan untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G1. |
Unit model per model yang disediakan untuk Amazon Titan Image Generator G2 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Image Generator G2. |
Unit model per model yang disediakan untuk Amazon Titan Lite V1 4K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Lite V1 4K. |
Unit model per model yang disediakan untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Multimodal Embeddings G1. |
Unit model per model yang disediakan untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Embeddings V2. |
Unit model per model yang disediakan untuk Amazon Titan Text G1 - Express 8K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text G1 - Express 8K. |
Unit model per model yang disediakan untuk Amazon Titan Text Premier V1 32K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Amazon Titan Text Premier V1 32K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Haiku 48K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Haiku 48K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3 Soneta 28K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3 Soneta 28K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 18K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 200K. |
Unit model per model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude 3.5 Soneta 51K. |
Unit model per model yang disediakan untuk Anthropic Claude Instant V1 100K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude Instant V1 100K. |
Unit model per model yang disediakan untuk Anthropic Claude V2 100K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 100K. |
Unit model per model yang disediakan untuk Anthropic Claude V2 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2 18K. |
Unit model per model yang disediakan untuk Anthropic Claude V2.1 18K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 18K. |
Unit model per model yang disediakan untuk Anthropic Claude V2.1 200K | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Anthropic Claude V2.1 200k. |
Unit model per model yang disediakan untuk Cohere Command | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command. |
Unit model per model yang disediakan untuk Cohere Command Light | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command Light. |
Unit model per model yang disediakan untuk Cohere Command R | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R 128k. |
Unit model per model yang disediakan untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Command R Plus 128k. |
Unit model per model yang disediakan untuk Cohere Embed English | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed English. |
Unit model per model yang disediakan untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Cohere Embed Multilingual. |
Unit model per model yang disediakan untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 13B. |
Unit model per model yang disediakan untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 70B. |
Unit model per model yang disediakan untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 13B. |
Unit model per model yang disediakan untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 2 Chat 70B. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 70B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3 8B Instruct. |
Unit model per model yang disediakan untuk Meta Llama 3.1 70B Instruct | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 70B Instruct. |
Unit model per model yang disediakan untuk Meta Llama 3.1 8B Instruct | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.1 8B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 1B Instruct. |
Unit model per model yang disediakan untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Meta Llama 3.2 3B Instruct. |
Unit model per model yang disediakan untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Large 2407. |
Unit model per model yang disediakan untuk Mistral Small | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Mistral Small. |
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 0.8 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 0.8 |
Unit model per model yang disediakan untuk Stability.ai Difusi Stabil XL 1.0 | Setiap Wilayah yang didukung: 0 | Ya |
Jumlah maksimum unit model yang dapat dialokasikan ke model yang disediakan untuk Stability.ai Stable Diffusion XL 1.0. |
Jumlah pekerjaan evaluasi model otomatis bersamaan | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum pekerjaan evaluasi model otomatis yang dapat Anda tentukan sekaligus di akun ini di Wilayah saat ini. |
Jumlah pekerjaan evaluasi model bersamaan yang menggunakan pekerja manusia | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum pekerjaan evaluasi model yang menggunakan pekerja manusia dapat Anda tentukan pada satu waktu di akun ini di Wilayah saat ini. |
Jumlah metrik kustom | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum metrik kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia. |
Jumlah kumpulan data prompt khusus dalam pekerjaan evaluasi model berbasis manusia | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum kumpulan data prompt kustom yang dapat Anda tentukan dalam pekerjaan evaluasi model berbasis manusia di akun ini di Wilayah saat ini. |
Jumlah dataset per pekerjaan | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum kumpulan data yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis. Ini termasuk kumpulan data prompt khusus dan bawaan. |
Jumlah pekerjaan evaluasi | Setiap Wilayah yang didukung: 5.000 | Tidak | Jumlah maksimum pekerjaan evaluasi model yang dapat Anda buat di akun ini di Wilayah saat ini. |
Jumlah metrik per dataset | Setiap Wilayah yang didukung: 3 | Tidak | Jumlah maksimum metrik yang dapat Anda tentukan per kumpulan data dalam pekerjaan evaluasi model otomatis. Ini termasuk metrik khusus dan bawaan. |
Jumlah model dalam pekerjaan evaluasi model yang menggunakan pekerja manusia | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model yang menggunakan pekerja manusia. |
Jumlah model dalam pekerjaan evaluasi model otomatis | Setiap Wilayah yang didukung: 1 | Tidak | Jumlah maksimum model yang dapat Anda tentukan dalam pekerjaan evaluasi model otomatis. |
Jumlah prompt dalam kumpulan data prompt kustom | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum permintaan yang dapat berisi kumpulan data prompt kustom. |
Unit teks kebijakan filter ApplyGuardrail konten sesuai permintaan per detik | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Konten per detik |
Sesuai permintaan Unit teks kebijakan topik yang ApplyGuardrail ditolak per detik | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan topik Ditolak per detik |
Unit teks kebijakan filter informasi ApplyGuardrail sensitif sesuai permintaan per detik | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter informasi sensitif per detik |
Unit teks kebijakan filter ApplyGuardrail Word sesuai permintaan per detik | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan filter Word per detik. |
Unit teks kebijakan ApplyGuardrail landasan kontekstual sesuai permintaan per detik |
us-east-1:106 us-west-2:106 Masing-masing Daerah yang didukung lainnya: 53 |
Tidak | Jumlah maksimum unit teks yang dapat diproses untuk kebijakan grounding kontekstual per detik |
Permintaan sesuai ApplyGuardrail permintaan per detik | Setiap Wilayah yang didukung: 25 | Tidak | Jumlah maksimum ApplyGuardrail API panggilan yang diizinkan per detik |
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jamba 1.5 Large | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jamba 1.5 Mini | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi AI21 Labs Jamba | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk AI21 Labs Jamba Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk Converse dan InvokeModel |
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk AI21 Labs Jurassic-2 Mid |
Permintaan sesuai InvokeModel permintaan per menit untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk AI21 Labs Jurassic-2 Ultra |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1. |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Amazon Titan Image Generator G V2. |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1. |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Embeddings | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2 |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Express | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Express |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Lite | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Lite |
Permintaan sesuai InvokeModel permintaan per menit untuk Amazon Titan Text Premier | Setiap Wilayah yang didukung: 100 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Amazon Titan Text Premier |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Haiku |
us-east-1:1.000 us-west-2:1.000 ap-northeast-1:200 ap-southeast-1:200 Masing-masing Wilayah yang didukung lainnya: 400 |
Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Haiku. |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 50 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude 3 Opus. |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3 Sonnet |
us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude 3 Soneta. |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 1.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku. |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Sonnet |
us-east-1:50 us-east-2:50 us-west-2:250 ap-northeast-2:50 ap-south-1:50 ap-southeast-2:50 Masing-masing Wilayah yang didukung lainnya: 20 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:250 Masing-masing Wilayah yang didukung lainnya: 50 |
Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude Instant |
us-east-1:1.000 us-west-2:1.000 Masing-masing Wilayah yang didukung lainnya: 400 |
Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude Instant |
Permintaan sesuai InvokeModel permintaan per menit untuk Anthropic Claude V2 |
us-east-1:500 us-west-2:500 Masing-masing Wilayah yang didukung lainnya: 100 |
Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Anthropic Claude V2 |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command. |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command Light | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command Light. |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command R | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command R 128k. |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Cohere Command R Plus 128k. |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Embed English | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed English. |
Permintaan sesuai InvokeModel permintaan per menit untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Cohere Embed Multilingual. |
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 13B. |
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 70B. |
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 Chat 13B. |
Permintaan sesuai InvokeModel permintaan per menit untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 2 Chat 70B. |
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 3 70B Instruct. |
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream permintaan untuk Meta Llama 3 8B Instruct. |
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Mistral 7B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mistral-7 0 b-instruct-v |
Permintaan sesuai InvokeModel permintaan per menit untuk Mistral AI Mistral Small | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral AI Mistral Small |
Permintaan sesuai InvokeModel permintaan per menit untuk Mistral Large | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dan InvokeModelWithResponseStream dalam satu menit untuk Mistral mistral-large 2402-v1 |
Permintaan sesuai InvokeModel permintaan per menit untuk Instruksi Mistral Mixtral 8x7b | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Mistral mixtral-8x7b-v0 |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion 3 Large | Setiap Wilayah yang didukung: 15 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Large. |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion 3 Medium | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion 3 Medium |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion XL 0.8 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 0.8 |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Diffusion XL 1.0 | Setiap Wilayah yang didukung: 60 | Tidak | Jumlah maksimum kali yang dapat Anda hubungi InvokeModel dalam satu menit untuk Stability.ai Stable Diffusion XL 1.0 |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Image Core | Setiap Wilayah yang didukung: 90 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Core. |
Permintaan sesuai InvokeModel permintaan per menit untuk Stability.ai Stable Image Ultra | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum kali Anda dapat menelepon InvokeModel dalam satu menit untuk Stability.ai Stable Image Ultra. |
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Large | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Large. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan. InvokeModel |
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jamba 1.5 Mini | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk AI21 Labs Jamba 1.5 Mini. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan. InvokeModel |
InvokeModel Token sesuai permintaan per menit untuk Instruksi AI21 Labs Jamba | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Instruksi AI21 Labs Jamba. Kuota mempertimbangkan jumlah gabungan token untuk Converse dan InvokeModel |
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Mid | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Mid. |
InvokeModel Token sesuai permintaan per menit untuk AI21 Labs Jurassic-2 Ultra | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk AI21 Labs Jurassic-2 Ultra. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Image Generator G1 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 2.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dalam satu menit untuk Amazon Titan Image Generator G1 V2. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Multimodal Embeddings G1 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Multimodal Embeddings G1. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Embeddings | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Embeddings V2 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Amazon Titan Text Embeddings V2. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Express | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Express. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Lite | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Lite. |
InvokeModel Token sesuai permintaan per menit untuk Amazon Titan Text Premier | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Amazon Titan Text Premier. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Haiku |
us-east-1:2.000.000 us-west-2:2.000.000 ap-northeast-1:200.000 ap-southeast-1:200.000 Masing-masing Wilayah yang didukung lainnya: 300.000 |
Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Haiku. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Opus | Setiap Wilayah yang didukung: 400.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Opus. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3 Sonnet |
us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Daerah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3 Soneta. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Haiku | Setiap Wilayah yang didukung: 2.000.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude 3.5 Haiku. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet |
us-east-1:400.000 us-east-2:400.000 us-west-2:2.000.000 ap-northeast-2:400.000 ap-south-1:400.000 ap-southeast-2:400.000 Masing-masing Daerah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Soneta. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude 3.5 Sonnet V2 |
us-west-2:2.000.000 Masing-masing Wilayah yang didukung lainnya: 400.000 |
Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Anthropic Claude 3.5 Sonnet V2. Kuota mempertimbangkan jumlah gabungan Converse, ConverseStream, InvokeModel dan. InvokeModelWithResponseStream |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude Instant |
us-east-1:1.000.000 us-west-2:1.000.000 Masing-masing Wilayah yang didukung lainnya: 300.000 |
Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude Instant. |
InvokeModel Token sesuai permintaan per menit untuk Anthropic Claude V2 |
us-east-1:500.000 us-west-2:500.000 Masing-masing Daerah yang didukung lainnya: 200.000 |
Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Anthropic Claude V2. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Command | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Command Light | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Command Light. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Command R | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command R 128k. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Command R Plus | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Cohere Command R Plus 128k. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Embed English | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed English. |
InvokeModel Token sesuai permintaan per menit untuk Cohere Embed Multilingual | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan InvokeModel dalam satu menit untuk Cohere Embed Multilingual. |
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 13B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 13B. |
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 70B. |
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 Chat 13B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 Chat 13B. |
InvokeModel Token sesuai permintaan per menit untuk Meta Llama 2 Chat 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan dari InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 2 Chat 70B. |
InvokeModel Token sesuai permintaan per menit untuk Instruksi Meta Llama 3 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 3 70B Instruct. |
InvokeModel Token sesuai permintaan per menit untuk Instruksi Meta Llama 3 8B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Meta Llama 3 8B Instruct. |
InvokeModel Token sesuai permintaan per menit untuk Instruksi Mistral AI Mistral 7B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral 7B Instruct. |
InvokeModel Token sesuai permintaan per menit untuk Mistral AI Mistral Large | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral Large. |
InvokeModel Token sesuai permintaan per menit untuk Mistral AI Mistral Small | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral AI Mistral Small. |
InvokeModel Token sesuai permintaan per menit untuk Instruksi Mistral AI Mixtral 8X7BB | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda berikan melalui InvokeModel dan InvokeModelWithResponseStream dalam satu menit. Kuota mempertimbangkan jumlah gabungan InvokeModel dan InvokeModelWithResponseStream token untuk Mistral mixtral-8x7 0. b-instruct-v |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 200 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 1B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 800 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Permintaan inferensi model sesuai permintaan per menit untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 400 | Tidak | Jumlah maksimum kali Anda dapat memanggil inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan permintaan untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 8B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 8B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 11B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 11B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 1B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 1B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 3B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 3B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.2 90B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.2 90B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Mistral Large 2407 | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Mistral Large 2407. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 405B | Setiap Wilayah yang didukung: 400.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 405B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Token inferensi model sesuai permintaan per menit untuk Instruksi Meta Llama 3.1 70B | Setiap Wilayah yang didukung: 300.000 | Tidak | Jumlah maksimum token yang dapat Anda kirimkan untuk inferensi model dalam satu menit untuk Meta Llama 3.1 70B Instruct. Kuota mempertimbangkan jumlah gabungan token untuk InvokeModel,, Converse InvokeModelWithResponseStream, dan. ConverseStream |
Node keluaran per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node output aliran. |
Parameter per fungsi | Setiap Wilayah yang didukung: 5 | Ya |
Jumlah maksimum parameter yang dapat Anda miliki dalam fungsi grup tindakan. |
PrepareAgent permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum PrepareAgent API permintaan per detik. |
PrepareFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum PrepareFlow permintaan per detik. |
Node prompt per aliran | Setiap Wilayah yang didukung: 10 | Ya |
Jumlah maksimum node prompt. |
Permintaan per akun | Setiap Wilayah yang didukung: 50 | Ya |
Jumlah maksimum petunjuk. |
Rekaman per pekerjaan inferensi batch | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan di semua file input dalam pekerjaan inferensi batch. |
Catatan per file input per pekerjaan inferensi batch | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah maksimum catatan dalam file input dalam pekerjaan inferensi batch. |
Entitas Regex di Filter Informasi Sensitif | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum regex filter pagar pembatas yang dapat disertakan dalam kebijakan kata |
Panjang regex dalam karakter | Setiap Wilayah yang didukung: 500 | Tidak | Panjang maksimum, dalam karakter, dari filter pagar pembatas regex |
Ambil permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum API permintaan Retrieve per detik. |
RetrieveAndGenerate permintaan per detik | Setiap Wilayah yang didukung: 5 | Tidak | Jumlah maksimum RetrieveAndGenerate API permintaan per detik. |
Node pengambilan S3 per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node pengambilan S3. |
Node penyimpanan S3 per aliran | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum node penyimpanan S3. |
Pekerjaan kustomisasi terjadwal | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum pekerjaan kustomisasi terjadwal. |
Ukuran prompt | Setiap Wilayah yang didukung: 4 | Tidak | Ukuran maksimum (dalam KB) dari prompt individu adalah kumpulan data prompt khusus. |
StartIngestionJob permintaan per detik | Setiap Wilayah yang didukung: 0.1 | Tidak | Jumlah maksimum StartIngestionJob API permintaan per detik. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar |
eu-south-1:10 Masing-masing Wilayah yang didukung lainnya: 20 |
Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model dasar. |
Jumlah pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus | Setiap Wilayah yang didukung: 3 | Ya |
Jumlah maksimum pekerjaan inferensi batch yang sedang berlangsung dan dikirimkan menggunakan model khusus |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Claude 3 Haiku v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Claude 3 Haiku. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 13B v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 13B. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Meta Llama 2 70B v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Meta Llama 2 70B. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 70B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 70B Instruct Fine-tuning. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.1 8B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.1 8B Instruct Fine-tuning. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 1B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.2 1B Instruct Fine-tuning. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Meta Llama 3.2 3B Instruct v1 Fine-tuning | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Meta Llama 3.2 3B Instruct Fine-tuning. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Generator Gambar Titan. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Image Generator G1 V2 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Fine-tuning Titan Image Generator V2. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Multimodal Embeddings G1 v1 | Setiap Wilayah yang didukung: 50.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Multimodal Embeddings. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Titan Text G1 - Express v1 Lanjutan Pra-Pelatihan | Setiap Wilayah yang didukung: 100.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Express. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Express v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Express. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Titan Text G1 - Lite v1 Lanjutan Pra-Pelatihan | Setiap Wilayah yang didukung: 100.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi diizinkan untuk pekerjaan Pra-Pelatihan Lanjutan Titan Text Lite. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Lite v1 | Setiap Wilayah yang didukung: 10.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Lite. |
Jumlah catatan pelatihan dan validasi untuk pekerjaan Fine-tuning Titan Text G1 - Premier v1 | Setiap Wilayah yang didukung: 20.000 | Ya |
Jumlah gabungan maksimum catatan pelatihan dan validasi memungkinkan untuk pekerjaan Fine-tuning Titan Text Premier. |
Waktu tugas untuk pekerja | Setiap Wilayah yang didukung: 30 | Tidak | Panjang maksimum (dalam hari) waktu yang dimiliki seorang pekerja untuk menyelesaikan tugas. |
Topik per pagar pembatas | Setiap Wilayah yang didukung: 30 | Tidak | Jumlah maksimum topik yang dapat didefinisikan di seluruh kebijakan topik pagar pembatas |
Total node per aliran | Setiap Wilayah yang didukung: 40 | Tidak | Jumlah maksimum node dalam aliran. |
UpdateAgent permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum UpdateAgent API permintaan per detik. |
UpdateAgentActionGroup permintaan per detik | Setiap Wilayah yang didukung: 6 | Tidak | Jumlah maksimum UpdateAgentActionGroup API permintaan per detik |
UpdateAgentAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateAgentAlias API permintaan per detik. |
UpdateAgentKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 4 | Tidak | Jumlah maksimum UpdateAgentKnowledgeBase API permintaan per detik. |
UpdateDataSource permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateDataSource API permintaan per detik. |
UpdateFlow permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateFlow permintaan per detik. |
UpdateFlowAlias permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateFlowAlias permintaan per detik. |
UpdateKnowledgeBase permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdateKnowledgeBase API permintaan per detik. |
UpdatePrompt permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum UpdatePrompt permintaan per detik. |
Ukuran kueri pengguna | Setiap Wilayah yang didukung: 1.000 | Tidak | Ukuran maksimum (dalam karakter) dari kueri pengguna. |
ValidateFlowDefinition permintaan per detik | Setiap Wilayah yang didukung: 2 | Tidak | Jumlah maksimum ValidateFlowDefinition permintaan per detik. |
Versi per pagar pembatas | Setiap Wilayah yang didukung: 20 | Tidak | Jumlah maksimum versi yang dapat dimiliki pagar pembatas |
Versi per prompt | Setiap Wilayah yang didukung: 10 | Tidak | Jumlah maksimum versi per prompt. |
Panjang kata dalam karakter | Setiap Wilayah yang didukung: 100 | Tidak | Panjang maksimum kata, dalam karakter, dalam daftar kata yang diblokir |
Kebijakan kata per kata | Setiap Wilayah yang didukung: 10.000 | Tidak | Jumlah maksimum kata yang dapat dimasukkan dalam daftar kata yang diblokir |