Amazon Bedrock

Guia do usuário

O que é o Amazon Bedrock?
- Preços do Amazon Bedrock
- Terminologia básica
Conceitos básicos
Acessar modelos de base
- Conceder permissões do IAM para solicitar acesso a modelos de base
- Adicionar ou remover o acesso aos modelos de base
Informações sobre modelos de base
Amazon Bedrock Marketplace
Envie prompts e gere respostas com a inferência de modelo
Processar vários prompts com inferência em lote
Configurar um recurso de invocação de modelo usando perfis de inferência
Conceitos de engenharia de prompts
Construir e armazenar prompts reutilizáveis com o Gerenciamento de Prompts
Impedir conteúdo prejudicial em modelos usando o Amazon Bedrock Guardrails
Avalie o desempenho dos recursos do Amazon Bedrock
Recupere dados e gere respostas com as bases de conhecimento Amazon Bedrock
Melhore a relevância das respostas de consulta com um modelo de reclassificação
Automatize tarefas em seu aplicativo usando agentes de IA
Armazene e recupere o estado da conversa com sessões
Crie um fluxo de trabalho generativo de IA com o Amazon Bedrock Flows
Personalize um modelo para seu caso de uso
Importar um modelo personalizado
Transforme dados não estruturados em insights significativos usando a automação Amazon Bedrock de dados
Aumente a produtividade com inferência entre regiões
Aumentar a capacidade de invocação do modelo com throughput provisionado
Marcação de recursos do Amazon Bedrock
Amazon Titan visão geral dos modelos
Administrar o Amazon Bedrock Studio
Segurança
Monitorar a integridade e a performance do Amazon Bedrock
Exemplos de código
detecção de anomalias
Crie recursos com AWS CloudFormation
Solução de problemas dos códigos de erro da API do Amazon Bedrock
Cotas
Histórico de documentos
AWS Glossário

Amazon Bedrock

Documentação
Amazon Bedrock
Guia do usuário

Processar vários prompts com inferência em lote

RSS

Modo de foco

Processar vários prompts com inferência em lote - Amazon Bedrock

Documentação Amazon Bedrock Guia do usuário

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Com a inferência em lote, é possível enviar vários prompts e gerar respostas de forma assíncrona. A inferência em lote ajuda você a processar um grande número de solicitações de forma eficaz, enviando uma única solicitação e gerando as respostas em um bucket do Amazon S3. Depois de definir as entradas do modelo em arquivos que você cria, carregue os arquivos em um bucket do S3. Envie uma solicitação de inferência em lote e especifique o bucket do S3. Quando o trabalho for concluído, será possível recuperar os arquivos de saída do S3. É possível usar a inferência em lote para melhorar a performance da inferência de modelos em grandes conjuntos de dados.

nota

A inferência em lote não é compatível com modelos provisionados.

Consulte os seguintes recursos para obter informações gerais sobre a inferência em lote:

Para ver os preços da inferência em lote, consulte os Preços do Amazon Bedrock.
Para ver as cotas de inferência em lote, consulte Amazon Bedrock endpoints and quotas no Referência geral da AWS.

Tópicos

Regiões e modelos compatíveis com inferência em lote
Pré-requisitos para inferência em lote
Criar um trabalho de inferência em lote
Monitorar trabalhos de inferência em lote
Interromper um trabalho de inferência em lote
Visualizar os resultados de um trabalho de inferência em lote
Exemplos de código para inferência em lote

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Cache imediato

Regiões e modelos compatíveis

Essa página foi útil? - Sim

Obrigado por nos informar que estamos fazendo um bom trabalho!

Se tiver tempo, conte-nos sobre o que você gostou para que possamos melhorar ainda mais.

Essa página foi útil? - Não

Obrigado por nos informar que precisamos melhorar a página. Lamentamos ter decepcionado você.

Se tiver tempo, conte-nos como podemos melhorar a documentação.

Precisa de ajuda?

Experimente AWS re:Post
Entre em contato com um especialista do AWS IQ

Privacidade Termos do site Preferências de cookies

Selecione suas preferências de cookies

Personalizar preferências de cookies

Essenciais

Desempenho

Funcionais

Publicidade

Não foi possível salvar as preferências de cookie

Processar vários prompts com inferência em lote

nota

Tópicos

Esta página foi útil?

Próximo tópico:

Tópico anterior:

Precisa de ajuda?