Consultar uma base de conhecimento e gerar respostas com base nos dados recuperados

Importante

As barreiras de proteção são aplicadas somente à entrada e à resposta gerada pelo LLM. Elas não são aplicados às referências recuperadas das bases de conhecimento em runtime.

Depois de configurar a base de conhecimento, você pode consultá-la e gerar respostas baseadas nos fragmentos recuperados dos dados da fonte usando a operação de API RetrieveAndGenerate. As respostas são exibidas com citações dos dados da fonte original. Também é possível usar um modelo de reclassificação em vez do classificador padrão das Bases de Conhecimento do Amazon Bedrock para classificar os fragmentos de origem quanto à relevância durante a recuperação.

Limitações de conteúdo multimodal

RetrieveAndGeneratetem suporte limitado para conteúdo multimodal. Ao usar o Nova Multimodal Embeddings, a funcionalidade do RAG é restrita apenas ao conteúdo de texto. Para suporte multimodal completo, incluindo processamento de áudio e vídeo, use o BDA com modelos de incorporação de texto. Para obter detalhes, consulte Crie uma base de conhecimento para conteúdo multimodal.

nota

As imagens exibidas da resposta Retrieve durante o fluxo RetrieveAndGenerate são incluídas no prompt para geração de resposta. A resposta RetrieveAndGenerate não pode incluir imagens, mas pode citar as fontes que contêm as imagens.

Para saber como consultar uma base de conhecimento, escolha a guia correspondente ao método de sua preferência e siga as etapas:

Console

Como testar a base de conhecimento

Faça login no AWS Management Console com uma identidade do IAM que tenha permissões para usar o console Amazon Bedrock. Em seguida, abra o console Amazon Bedrock em https://console.aws.amazon.com/bedrock.
No painel de navegação à esquerda, selecione Bases de conhecimento.
Na seção Bases de conhecimento, execute uma das ações a seguir.
- Escolha o botão de opção ao lado da base de conhecimento que deseja testar e selecione Testar base de conhecimento. Uma janela de teste é expandida à direita.
- Escolha a base de conhecimento que deseja testar. Uma janela de teste é expandida à direita.
Para gerar respostas com base em informações recuperadas da base de conhecimento, ative a opção Gerar respostas para a consulta. O Amazon Bedrock gerará respostas com base nas fontes de dados e citará as informações fornecidas com notas de rodapé.
Para escolher um modelo para usar para geração de respostas, escolha Selecionar um modelo. Selecione Aplicar.
(Opcional) Selecione o ícone de configurações ( ) para abrir Configurações. Para ter mais informações configurações, consulte Configurar e personalizar consultas e geração de respostas.
Insira uma consulta na caixa de texto da janela de chat e selecione Executar para retornar respostas da base de conhecimento.
Selecione uma nota de rodapé para ver um trecho da fonte citada por essa parte da resposta. Escolha o link para navegar até o objeto do S3 que contém o arquivo.
Para ver detalhes sobre os fragmentos exibidos, selecione Mostrar detalhes da fonte.
- Para ver as configurações que definiu para a consulta, expanda Configurações de consulta.
- Para ver detalhes sobre um fragmento de origem, expanda-o escolhendo a seta para a direita ( ) ao lado dele. É possível editar as seguintes informações:
  - O texto bruto do fragmento de origem. Para copiar esse texto, escolha o ícone de cópia ( ). Se tiver usado o Amazon S3 para armazenar os dados, escolha o ícone de link externo ( ) para navegar ao objeto do S3 que contém o arquivo.
  - Os metadados associados ao fragmento de origem, se você usou o Amazon S3 para armazenar seus dados. As attribute/field chaves e os valores são definidos no .metadata.json arquivo associado ao documento de origem. Para ter mais informações, consulte a seção Metadados e filtragem em Configurar e personalizar consultas e geração de respostas.

Opções do chat

Para usar um modelo diferente para geração de resposta, selecione Alterar modelo. Se você alterar o modelo, o texto na janela de chat será completamente apagado.
Opte por recuperar fragmentos de origem diretamente desmarcando Gerar respostas. Se você alterar a configuração, o texto na janela de chat será completamente apagado.
Para limpar a janela de chat, selecione o ícone de vassoura ( ).
Para copiar toda a saída na janela de chat, selecione o ícone de cópia ( ).

API

Para consultar uma base de conhecimento e usar um modelo de base para gerar respostas de acordo com os resultados das fontes de dados, envie uma solicitação RetrieveAndGenerate com um endpoint de runtime do Agentes para Amazon Bedrock.

A API RetrieveAndGenerateStream exibe os dados em um formato de streaming e permite acessar as respostas geradas em fragmentos sem esperar pelo resultado completo.

Os seguintes campos são obrigatórios:

nota

A resposta da API contém eventos de citação. O membro citation foi descontinuado. Em vez disso, recomendamos usar os campos generatedResponse e retrievedReferences. Para referência, consulte CitationEvent.

Campo	Descrição básica
input	Contém um campo `text` para especificar a consulta.
recuperar AndGenerateConfiguration	Contém um RetrieveAndGenerateConfiguration, que especifica configurações para recuperação e geração. Veja mais detalhes abaixo.

Os seguintes campos são opcionais:

Campo	Caso de uso
sessionId	Use o mesmo valor de uma sessão anterior para dar continuidade a essa sessão e manter o contexto dela para o modelo.
sessionConfiguration	Para incluir uma chave personalizada do KMS para criptografia da sessão.

Inclua o knowledgeBaseConfiguration campo no RetrieveAndGenerateConfiguration. Esse campo é mapeado para um KnowledgeBaseRetrieveAndGenerateConfigurationobjeto, que contém os seguintes campos:

Os seguintes campos são obrigatórios:

Campo	Descrição básica
conhecimento BaseId	O ID da base de conhecimento a ser consultada.
modelArn	O ARN do modelo de base ou perfil de inferência a ser usado para geração.

Os seguintes campos são opcionais:

Campo	Caso de uso
retrievalConfiguration	Para incluir configurações de consulta para personalizar a pesquisa vetorial. Para obter mais informações, consulte KnowledgeBaseRetrievalConfiguration.
orchestrationConfiguration	Para especificar as configurações de como o modelo processa o prompt antes da recuperação e geração. Para obter mais informações, consulte OrchestrationConfiguration.
generationConfiguration	Para especificar configurações para geração de resposta. Para obter mais informações, consulte GenerationConfiguration.

Você pode usar um modelo de reclassificação em relação ao modelo de classificação padrão do Amazon Bedrock Knowledge Bases incluindo o rerankingConfiguration campo no. KnowledgeBaseVectorSearchConfiguration KnowledgeBaseRetrievalConfiguration O rerankingConfiguration campo mapeia para um VectorSearchRerankingConfigurationobjeto, no qual você pode especificar o modelo de reclassificação a ser usado, quaisquer campos de solicitação adicionais a serem incluídos, atributos de metadados para filtrar documentos durante a reclassificação e o número de resultados a serem retornados após a reclassificação. Para obter mais informações, consulte VectorSearchRerankingConfiguration.

nota

Se o numberOfRerankedResults valor especificado for maior que o numberOfResults valor no KnowledgeBaseVectorSearchConfiguration, o número máximo de resultados que serão retornados será o valor paranumberOfResults. Uma exceção é se você usar a decomposição de consultas (para ter mais informações, consulte a seção Modificações de consulta em Configurar e personalizar consultas e geração de respostas. Se você usar a decomposição de consultas, numberOfRerankedResults pode ser até cinco vezes o valor de numberOfResults.

A resposta exibe resposta gerada no campo output e os fragmentos de origem citados como uma matriz no campo citations. Cada objeto citação contém os campos a seguir.

Campo	Descrição básica
gerado ResponsePart	No campo `textResponsePart`, o `text` ao qual a citação pertence está incluído. O campo `span` fornece os índices para o início e o fim da parte da saída que tem uma citação.
retrievedReferences	Uma matriz de RetrievedReferenceobjetos, cada um contendo o fragmento `content` de origem `metadata` associado ao documento e o URI ou URL `location` do documento na fonte de dados. Se o conteúdo for uma imagem, o URI de dados do conteúdo codificado em base64 será exibido no seguinte formato: `data:image/jpeg;base64,${base64-encoded string}`.

A resposta também exibe um valor sessionId que é possível reutilizar em outra solicitação para manter a mesma conversa.

Se você incluiu uma guardrailConfiguration na solicitação, o campo guardrailAction informará se o conteúdo foi bloqueado ou não.

Se os dados recuperados contiverem imagens, a resposta também exibirá os seguintes cabeçalhos de resposta, que contêm metadados para fragmentos de origem exibidos na resposta:

x-amz-bedrock-kb-byte-content-source: contém o URI do Amazon S3 da imagem.
x-amz-bedrock-kb-description: contém a string codificada em base64 da imagem.

nota

Não é possível filtrar esses cabeçalhos de resposta de metadados ao configurar filtros de metadados.

nota

Se você receber um erro informando que o prompt excede o limite de caracteres ao gerar respostas, é possível encurtar o prompt das seguintes maneiras:

Reduza o número máximo de resultados recuperados (isso reduz o que é preenchido para o espaço reservado $search_results$ no Modelos de prompt da base de conhecimento: geração de orquestração &).
Recrie a fonte de dados com uma estratégia de fragmentação que usa fragmentos menores (isso reduz o que é preenchido para o espaço reservado $search_results$ no Modelos de prompt da base de conhecimento: geração de orquestração &).
Encurte o modelo do prompt.
Encurte a consulta do usuário (isso reduz o que é preenchido para o espaço reservado $query$ no Modelos de prompt da base de conhecimento: geração de orquestração &).

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Teste sua base de conhecimento gerenciada pelo cliente

Gerar uma consulta a dados estruturados