Consulte uma base de conhecimento e gere respostas de IA - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Consulte uma base de conhecimento e gere respostas de IA

Você pode consultar sua base de conhecimento para recuperar informações de seus dados proprietários. Quando você insere uma consulta de teste, partes relevantes do texto da fonte de dados são recuperadas. Você também pode gerar respostas para a consulta, com base nos fragmentos de origem recuperados.

Para saber como consultar sua base de conhecimento, selecione a guia correspondente ao seu método de escolha e siga as etapas.

Console
Como testar a base de conhecimento
  1. Faça login no AWS Management Console usando uma IAMfunção com permissões do Amazon Bedrock e abra o console do Amazon Bedrock em. https://console.aws.amazon.com/bedrock/

  2. No painel de navegação esquerdo, selecione Bases de conhecimento.

  3. Na seção Bases de conhecimento, execute uma das seguintes ações:

    • Escolha o botão de opções ao lado da base de conhecimento que deseja testar e selecione Testar base de conhecimento. Uma janela de teste se expande a partir da direita.

    • Escolha a base de conhecimento que você deseja testar. Uma janela de teste se expande a partir da direita.

  4. Selecione ou desmarque Gerar respostas para sua consulta, dependendo do seu caso de uso.

    • Para retornar informações recuperadas diretamente da sua base de conhecimento, desative a opção Gerar respostas. O Amazon Bedrock retornará trechos de texto de suas fontes de dados que sejam relevantes para a consulta.

    • Para gerar respostas com base nas informações recuperadas da sua base de conhecimento, ative Gerar respostas. O Amazon Bedrock gerará respostas com base em suas fontes de dados e citará as informações fornecidas com notas de rodapé.

  5. Se você ativar Gerar respostas, escolha Selecionar modelo para escolher um modelo a ser usado na geração de respostas. Em seguida, selecione Aplicar.

  6. (Opcional) Selecione o ícone de configurações ( Three horizontal sliders with adjustable circular controls for settings or parameters. ) para abrir Configurações. Você pode modificar as seguintes configurações:

    • Tipo de pesquisa — especifique como sua base de conhecimento é consultada. Para obter mais informações, consulte Tipo de pesquisa.

    • Número máximo de resultados recuperados — Especifique o número máximo de resultados a serem recuperados. Para obter mais informações, consulte Número máximo de resultados recuperados.

    • Filtros — especifique até 5 grupos de filtros e até 5 filtros em cada grupo para usar com os metadados dos seus arquivos. Para obter mais informações, consulte Metadados e filtragem.

    • Modelo de solicitação da base de conhecimento — Se você ativar a opção Gerar respostas, poderá substituir o modelo de solicitação padrão pelo seu próprio para personalizar a solicitação enviada ao modelo para geração de resposta. Para obter mais informações, consulte Modelo de prompt da base de conhecimento.

    • Guardrails — Se você ativar a opção Gerar respostas, poderá testar como os guardrails funcionam com as solicitações e respostas da sua base de conhecimento. Para obter mais informações, consulte Proteções.

  7. Insira uma consulta na caixa de texto da janela de chat e selecione Executar para retornar respostas da base de conhecimento.

  8. Você pode examinar a resposta das seguintes formas.

    • Se você não gerou respostas, os trechos de texto são retornados diretamente em ordem de relevância.

    • Se você gerou respostas, selecione uma nota de rodapé para ver um trecho da fonte citada para essa parte da resposta. Escolha o link para navegar até o objeto do S3 que contém o arquivo.

    • Para ver detalhes sobre os trechos citados para cada nota de rodapé, selecione Mostrar detalhes da fonte. Você pode realizar as seguintes ações no painel Detalhes da fonte:

      • Para ver as configurações que você definiu para consulta, expanda Configurações de consulta.

      • Para ver detalhes sobre um fragmento de origem, expanda-o escolhendo a seta para a direita ( Play button icon with a triangular shape pointing to the right. ) ao lado dele. Você pode ver as seguintes informações:

        • O texto bruto do fragmento de origem. Para copiar esse texto, escolha o ícone de cópia ( Icon representing a crop or resize function, with two overlapping rectangles. ). Se estiver usando o Amazon S3 para armazenar seus dados, navegue até o objeto S3 que contém o arquivo e escolha o ícone do link externo (). Icon of a square with an arrow pointing outward from its top-right corner.

        • Os metadados associados ao fragmento de origem. Se estiver usando o Amazon S3 para armazenar seus dados, as chaves e valores de atributos/campos são definidos no .metadata.json arquivo associado ao documento de origem. Para obter mais informações, consulte Configuração de conexão do Amazon S3, incluindo metadados.

Opções de bate-papo
  1. Se você estiver gerando respostas, você pode selecionar Alterar modelo para usar um modelo diferente para geração de respostas. Se você alterar o modelo, o texto na janela de chat será completamente apagado.

  2. Alterne entre gerar respostas para sua consulta e retornar cotações diretas selecionando ou desmarcando Gerar respostas. Se você alterar a configuração, o texto na janela de chat será completamente apagado.

  3. Para limpar a janela de bate-papo, selecione o ícone da vassoura ( ).

  4. Para copiar toda a saída na janela de bate-papo, selecione o ícone de cópia ( Icon representing a crop or resize function, with two overlapping rectangles. ).

API

Recuperar

Para consultar uma base de conhecimento e retornar somente texto relevante de fontes de dados, envie um Retrievesolicitação (consulte o link para ver os formatos de solicitação e resposta e detalhes do campo) com um endpoint de tempo de execução do Agents for Amazon Bedrock.

A tabela a seguir descreve resumidamente os parâmetros e o corpo da solicitação (para obter informações detalhadas e a estrutura da solicitação, consulte a sintaxe da solicitação de recuperação):

Variável Obrigatório? Caso de uso
knowledgeBaseId Sim Para especificar a base de conhecimento a ser consultada
retrievalQuery Sim Contém um text campo para especificar a consulta
nextToken Não Para retornar o próximo lote de respostas
retrievalConfiguration Não Incluir configurações de consulta para personalizar a pesquisa vetorial.

A tabela a seguir descreve resumidamente o corpo da resposta (para obter informações detalhadas e a estrutura da resposta, consulte a sintaxe da resposta de recuperação):

Variável Caso de uso
retrievalResults Contém os fragmentos de origem, a localização da fonte no Amazon S3 e uma score relevância para o fragmento.
nextToken Para usar em outra solicitação para retornar o próximo lote de resultados.

RetrieveAndGenerate

Para consultar uma base de conhecimento e usar um modelo básico para gerar respostas com base nos resultados das fontes de dados, envie um RetrieveAndGeneratesolicitação com um endpoint de tempo de execução do Agents for Amazon Bedrock.

A tabela a seguir descreve resumidamente os parâmetros e o corpo da solicitação (para obter informações detalhadas e a estrutura da solicitação, consulte a sintaxe da RetrieveAndGenerate solicitação):

Variável Obrigatório? Caso de uso
input Sim Contém um text campo para especificar a consulta
retrieveAndGenerateConfiguração Sim Para especificar a base de conhecimento a ser consultada e o modelo ou perfil de inferência a ser usado para geração de respostas e configurações de consulta opcionais.
sessionId Não Use o mesmo valor para continuar a mesma sessão e manter as informações
sessionConfiguration Não Para incluir uma KMS chave para criptografia da sessão

A tabela a seguir descreve resumidamente o corpo da resposta (para obter informações detalhadas e a estrutura da resposta, consulte a sintaxe da resposta de recuperação):

Variável Caso de uso
citações Contém partes da resposta gerada em cada objeto dentro dogeneratedResponsePart, e o fragmento de origem no content objeto e a localização da fonte no Amazon S3 no objeto location do retrievedReferences objeto.
guardrailAction Especifica se há uma grade de proteção usada na resposta.
output Contém toda a resposta gerada.
sessionId Contém o ID da sessão, que você pode reutilizar em outra solicitação para manter a mesma conversa
nota

Se você receber um erro informando que o prompt excede o limite de caracteres ao gerar respostas, você pode encurtar o prompt das seguintes maneiras: