As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O throughput é definido pelo número e pela taxa de entradas e saídas que um modelo processa e retorna. É possível comprar throughput provisionado para provisionar um nível mais alto de throughput para um modelo a um custo fixo. Se você personalizou um modelo, compre throughput provisionado para poder usá-lo.
Você recebe cobrança por hora pelo throughput provisionado que você compra. Para obter informações detalhadas sobre preços, consulte Preços do Amazon Bedrock
-
O modelo que você escolhe (para modelos personalizados, o preço é o mesmo do modelo de base do qual ele foi personalizado).
-
O número de unidades modelo (MUs) que você especifica para a taxa de transferência provisionada. Uma MU fornece um nível de throughput específico para o modelo especificado. O nível de throughput de uma MU especifica o seguinte:
-
O número de tokens de entrada que uma MU pode processar em todas as solicitações em um período de um minuto.
-
O número de tokens de saída que uma MU pode gerar em todas as solicitações em um período de um minuto.
nota
Para obter mais informações sobre o que uma MU especifica, entre em contato com o gerente da Conta da AWS .
-
-
O período em que você se compromete a manter o throughput provisionado. Quanto maior o período do compromisso, mais descontos haverá no preço por hora. É possível escolher entre os seguintes níveis de comprometimento:
-
Sem compromisso: é possível excluir o throughput provisionado a qualquer momento.
-
Um mês: não é possível excluir o throughput provisionado até que o termo de compromisso de um mês tenha transcorrido.
-
Seis meses: não é possível excluir o throughput provisionado até que o termo de compromisso de seis meses tenha transcorrido.
nota
O faturamento continua até que você exclua o throughput provisionado.
-
As etapas a seguir descrevem o processo de configuração e uso do throughput provisionado.
-
Determine o número MUs que você deseja comprar para uma taxa de transferência provisionada e a quantidade de tempo durante a qual você deseja se comprometer a usar a taxa de transferência provisionada.
-
Compre throughput provisionado para um modelo de base.
-
Depois que o modelo provisionado for criado, você poderá usá-lo para executar inferência do modelo.