Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Aumentar a capacidade de invocação do modelo com throughput provisionado no Amazon Bedrock

Modo de foco
Aumentar a capacidade de invocação do modelo com throughput provisionado no Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O throughput é definido pelo número e pela taxa de entradas e saídas que um modelo processa e retorna. É possível comprar throughput provisionado para provisionar um nível mais alto de throughput para um modelo a um custo fixo. Se você personalizou um modelo, compre throughput provisionado para poder usá-lo.

Você recebe cobrança por hora pelo throughput provisionado que você compra. Para obter informações detalhadas sobre preços, consulte Preços do Amazon Bedrock. O preço por hora depende dos seguintes fatores:

  1. O modelo que você escolhe (para modelos personalizados, o preço é o mesmo do modelo de base do qual ele foi personalizado).

  2. O número de unidades modelo (MUs) que você especifica para a taxa de transferência provisionada. Uma MU fornece um nível de throughput específico para o modelo especificado. O nível de throughput de uma MU especifica o seguinte:

    • O número de tokens de entrada que uma MU pode processar em todas as solicitações em um período de um minuto.

    • O número de tokens de saída que uma MU pode gerar em todas as solicitações em um período de um minuto.

    nota

    Para obter mais informações sobre o que uma MU especifica, entre em contato com o gerente da Conta da AWS .

  3. O período em que você se compromete a manter o throughput provisionado. Quanto maior o período do compromisso, mais descontos haverá no preço por hora. É possível escolher entre os seguintes níveis de comprometimento:

    • Sem compromisso: é possível excluir o throughput provisionado a qualquer momento.

    • Um mês: não é possível excluir o throughput provisionado até que o termo de compromisso de um mês tenha transcorrido.

    • Seis meses: não é possível excluir o throughput provisionado até que o termo de compromisso de seis meses tenha transcorrido.

    nota

    O faturamento continua até que você exclua o throughput provisionado.

As etapas a seguir descrevem o processo de configuração e uso do throughput provisionado.

  1. Determine o número MUs que você deseja comprar para uma taxa de transferência provisionada e a quantidade de tempo durante a qual você deseja se comprometer a usar a taxa de transferência provisionada.

  2. Compre throughput provisionado para um modelo de base.

  3. Depois que o modelo provisionado for criado, você poderá usá-lo para executar inferência do modelo.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.