Cotas do Amazon Bedrock

Você Conta da AWS tem cotas padrão, anteriormente chamadas de limites, para o Amazon Bedrock. Para visualizar as cotas de serviço do Amazon Bedrock, execute um dos seguintes procedimentos:

Siga as etapas em Visualizar cotas de serviço e selecione Amazon Bedrock como o serviço.
Consulte Cotas de serviço do Amazon Bedrock no Referência geral da AWS.

No Amazon Bedrock, a inferência do modelo é controlada por cotas de uso de tokens. Alguns modelos usam tokens em uma taxa mais alta. Para ter mais informações sobre essas taxas e como otimizar o uso de tokens, consulte Como os tokens são contados no Amazon Bedrock.

O Amazon Bedrock oferece dois endpoints de inferência — bedrock-runtime e bedrock-mantle — cada um com suas próprias alocações de cotas por modelo. O tráfego para os dois endpoints é rastreado com base em cotas separadas, mesmo ao chamar o mesmo modelo subjacente. Para obter mais detalhes, consulte Cotas para o endpoint de tempo de execução básico e Cotas para o endpoint rocho-mantle.

Para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock, as cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota.

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Exemplos de código

Contagem de tokens