Configurar e personalizar consultas e geração de respostas

Você pode configurar e personalizar a recuperação e a geração de respostas, aumentando ainda mais a relevância das respostas. Por exemplo, você pode aplicar filtros a campos/atributos de metadados do documento para usar os documentos atualizados mais recentemente ou documentos com horários de modificação recentes.

nota

Todas as configurações a seguir, exceto orquestração e geração, são aplicáveis somente a fontes de dados não estruturadas.

Para saber mais sobre essas configurações no console ou na API, selecione um dos tópicos a seguir:

Quando você consulta uma base de conhecimento, o Amazon Bedrock retorna até cinco resultados na resposta por padrão. Cada resultado corresponde a um fragmento de origem.

Para modificar o número máximo de resultados a serem retornados, escolha a guia do seu método preferido e siga as etapas:

O tipo de pesquisa define como fontes de dados na base de conhecimento são consultadas. Estes tipos de pesquisa são possíveis:

Padrão: o Amazon Bedrock decide a estratégia de pesquisa para você.
Híbrida: combina pesquisa com incorporações de vetores (pesquisa semântica) com pesquisa no texto bruto. Atualmente, a pesquisa híbrida só é compatível com lojas de vetores Amazon OpenSearch Serverless que contêm um campo de texto filtrável. Se você usa um armazenamento vetorial diferente ou se o seu armazenamento vetorial Amazon OpenSearch Serverless não contém um campo de texto filtrável, a consulta usa a pesquisa semântica.
Semântica: só pesquisa incorporações de vetores.

Para saber como definir o tipo de pesquisa, escolha a guia do seu método preferido e siga as etapas:

Console

Siga as etapas do console em Consulte uma base de conhecimento e recupere dados ouConsulte uma base de conhecimento e gere respostas com base nos dados recuperados. Ao abrir o painel Configurações, expanda a seção Tipo de pesquisa, ative Substituir pesquisa padrão e selecione uma opção.

API

Quando você faz um Retrieve ou RetrieveAndGeneratesolicitação, inclusão de um retrievalConfiguration campo, mapeado para um KnowledgeBaseRetrievalConfigurationobjeto. Para ver a localização desse campo, consulte a Retrieve e RetrieveAndGeneratecorpos de solicitação na referência da API.

O objeto JSON a seguir mostra os campos mínimos necessários no KnowledgeBaseRetrievalConfigurationobjeto para definir as configurações do tipo de pesquisa:


"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "overrideSearchType": "HYBRID | SEMANTIC"
    }
}

Especifique o tipo de pesquisa no campo overrideSearchType. Você tem as seguintes opções:

Se você não especificar um valor, o Amazon Bedrock decide qual estratégia de pesquisa é mais adequada para sua configuração de armazenamento de vetores.
HÍBRIDA: o Amazon Bedrock consulta a base de conhecimento usando as incorporações de vetores e o texto bruto. Essa opção só está disponível se você estiver usando um armazenamento vetorial Amazon OpenSearch Serverless configurado com um campo de texto filtrável.
SEMÂNTICA: o Amazon Bedrock consulta a base de conhecimento usando as incorporações de vetores.

Você pode aplicar filtros ao documento fields/attributes to help you further improve the relevancy of responses. Your data sources can include document metadata attributes/fields para filtrar e especificar quais campos incluir nas incorporações. Por exemplo, o documento “epoch_modification_time” ou o número de segundos transcorridos desde 1.º de janeiro de 1970, quando o documento foi atualizado pela última vez. Você pode filtrar os dados mais recentes, em que “epoch_modification_time” é maior que um determinado número. Esses documentos mais recentes podem ser usados na consulta.

Para usar filtros ao consultar uma base de conhecimento, verifique se a base de conhecimento atende aos seguintes requisitos:

Ao configurar o conector da fonte de dados, a maioria dos conectores rastreia os principais campos de metadados dos documentos. Se você estiver usando um bucket do Amazon S3 como fonte de dados, o bucket deve incluir pelo menos um fileName.extension.metadata.json para o arquivo ou documento ao qual está associado. Consulte Campos de metadados do documento em Configuração de conexão para obter mais informações sobre como configurar o arquivo de metadados.
Se o índice vetorial da sua base de conhecimento estiver em um armazenamento vetorial Amazon OpenSearch Serverless, verifique se o índice vetorial está configurado com o faiss mecanismo. Se o índice de vetores estiver configurado com o mecanismo nmslib, será necessário fazer o seguinte:
- Crie uma nova base de conhecimento no console e deixe que o Amazon Bedrock crie automaticamente um índice vetorial no Amazon OpenSearch Serverless para você.
- Criar outro índice de vetores no armazenamento de vetores e selecionar faiss como o mecanismo. Em seguida, criar uma base de conhecimento e especificar o novo índice de vetores.
Se estiver adicionando metadados a um índice de vetores existente em um cluster de banco de dados do Amazon Aurora, você deverá adicionar uma coluna à tabela para cada atributo de metadados nos arquivos de metadados antes de iniciar a ingestão. Os valores de atributo de metadados serão gravados nessas colunas.

Se você tiver documentos PDF em sua fonte de dados e usar o Amazon OpenSearch Serverless para seu armazenamento de vetores: as bases de conhecimento do Amazon Bedrock gerarão números de página de documentos e os armazenarão em um campo/atributo de metadados chamado -. x-amz-bedrock-kb document-page-number Observe que os números de página armazenados em um campo de metadados não são suportados se você optar por não agrupar seus documentos.

Você pode usar os operadores de filtragem para filtrar os resultados ao consultar:

Operadores de filtragem
Operador	Console	Nome do filtro da API	Tipos de dados de atributo compatíveis	Resultados filtrados
Igual	=	equals	string, número, booliano	O atributo corresponde ao valor fornecido por você
Não é igual a	!=	notEquals	string, número, booliano	O atributo não corresponde ao valor fornecido por você
Maior que	>	greaterThan	número	O atributo é maior que o valor fornecido por você
É maior que ou igual a	>=	greaterThanOrIgual	número	O atributo é maior que ou igual ao valor fornecido por você
Menor que	<	lessThan	número	O atributo é menor que o valor fornecido por você
Menor ou igual a	<=	lessThanOrIgual	número	O atributo é menor que ou igual ao valor fornecido por você
Em	:	in	lista de strings	O atributo está na lista que você fornece (atualmente é mais compatível com os armazenamentos vetoriais Amazon OpenSearch Serverless)
Não está em	!:	notIn	lista de strings	O atributo não está na lista que você fornece (atualmente é melhor compatível com os armazenamentos vetoriais Amazon OpenSearch Serverless)
Inicia com	^	startsWith	string	O atributo começa com a string que você fornece (atualmente é melhor compatível com os armazenamentos vetoriais Amazon OpenSearch Serverless)

Para combinar operadores de filtragem, você pode usar os seguintes operadores lógicos:

Operadores lógicos
Operador	Console	Nome do campo de filtro da API	Resultados filtrados
E	and	andAll	Os resultados atendem a todas as expressões de filtragem no grupo
Ou	or	orAll	Os resultados atendem a pelo menos uma das expressões de filtragem no grupo

Para saber como filtrar resultados usando metadados, escolha a guia do seu método preferido e siga as etapas:

Console

Siga as etapas do console em Consulte uma base de conhecimento e recupere dados ouConsulte uma base de conhecimento e gere respostas com base nos dados recuperados. Ao abrir o painel Configurações, você verá uma seção Filtros. Os seguintes procedimentos descrevem casos de uso diferentes:

Para adicionar um filtro, crie uma expressão de filtragem inserindo um atributo de metadados, um operador de filtragem e um valor na caixa. Separe cada parte da expressão com um espaço em branco. Pressione Enter para adicionar o filtro.

Para obter uma lista dos operadores de filtragem aceitos, consulte a tabela Operadores de filtragem acima. Você também pode ver uma lista dos operadores de filtragem ao adicionar um espaço em branco após o atributo de metadados.

nota
Você deve colocar as strings entre aspas.

Por exemplo, você pode filtrar resultados dos documentos de origem que contenham um atributo de metadados genre cujo valor é "entertainment" adicionando o seguinte filtro: genre = "entertainment".
Para adicionar outro filtro, insira outra expressão de filtragem na caixa e pressione Enter. Você pode adicionar até cinco filtros no grupo.
Por padrão, a consulta retorna resultados que atendam a todas as expressões de filtragem fornecidas por você. Para retornar resultados que atendam a pelo menos uma das expressões de filtragem, escolha o menu suspenso e entre duas operações de filtragem e selecione ou.
Para combinar operadores lógicos diferentes, selecione + Adicionar grupo para adicionar um grupo de filtros. Insira expressões de filtragem no novo grupo. Você pode adicionar até 5 grupos de filtros.
Para alterar o operador lógico usado entre todos os grupos de filtragem, escolha o menu suspenso E entre dois grupos de filtros e selecione OU.
Para editar um filtro, selecione-o, modifique a operação de filtragem e escolha Aplicar.
Para remover um grupo de filtros, escolha o ícone de lixeira ( ) ao lado do grupo. Para remover um filtro, escolha o ícone de exclusão ( ) ao lado do filtro.

A imagem a seguir mostra um exemplo de configuração do filtro que mostra todos os documentos gravados depois de 2018 cujo gênero é "entertainment", além de documentos cujo gênero é "cooking" ou "sports" cujo autor começa com "C".

API

Os objetos JSON a seguir mostram os campos mínimos necessários no KnowledgeBaseRetrievalConfigurationobjeto para definir filtros para diferentes casos de uso:

Use um operador de filtragem (consulte a tabela Operadores de filtragem acima).


"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "filter": {
            "<filter-type>": {
                "key": "string",
                "value": "string" | number | boolean | ["string", "string", ...]
            }
        }
    }
}

Use um operador lógico (consulte a tabela Operadores lógicos acima) para combinar até cinco.


"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "filter": {
            "andAll | orAll": [
                "<filter-type>": {
                    "key": "string",
                    "value": "string" | number | boolean | ["string", "string", ...]
                },
                "<filter-type>": {
                    "key": "string",
                    "value": "string" | number | boolean | ["string", "string", ...]
                },
                ...
            ]
        }
    }
}

Use um operador lógico para combinar até cinco operadores de filtragem em um grupo de filtros e um segundo operador lógico para combinar esse grupo de filtros com outro operador de filtragem.


"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "filter": {
            "andAll | orAll": [
                "andAll | orAll": [
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    ...
                ],
                "<filter-type>": {
                    "key": "string",
                    "value": "string" | number | boolean | ["string", "string", ...]
                }
            ]
        }
    }
}

Combine até cinco grupos de filtros incorporando-os em outro operador lógico. Você pode criar um nível de incorporação.


"retrievalConfiguration": {
    "vectorSearchConfiguration": {
        "filter": {
            "andAll | orAll": [
                "andAll | orAll": [
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    ...
                ],
                "andAll | orAll": [
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    "<filter-type>": {
                        "key": "string",
                        "value": "string" | number | boolean | ["string", "string", ...]
                    },
                    ...
                ]
            ]
        }
    }
}

A seguinte tabela descreve os tipos de filtro que você pode usar:

Campo	Tipos de dados de valor compatíveis	Resultados filtrados
`equals`	string, número, booliano	O atributo corresponde ao valor fornecido por você
`notEquals`	string, número, booliano	O atributo não corresponde ao valor fornecido por você
`greaterThan`	número	O atributo é maior que o valor fornecido por você
`greaterThanOrEquals`	número	O atributo é maior que ou igual ao valor fornecido por você
`lessThan`	número	O atributo é menor que o valor fornecido por você
`lessThanOrEquals`	número	O atributo é menor que ou igual ao valor fornecido por você
`in`	lista de strings	O atributo está na lista fornecida por você
`notIn`	lista de strings	O atributo não está na lista fornecida por você
`startsWith`	string	O atributo começa com a string que você fornece (compatível somente com lojas de vetores Amazon OpenSearch Serverless)

Para combinar tipos de filtro, você pode usar um dos seguintes operadores lógicos:

Campo	Está associado a	Resultados filtrados
`andAll`	Lista de até cinco tipos de filtro	Os resultados atendem a todas as expressões de filtragem no grupo
`orAll`	Lista de até cinco tipos de filtro	Os resultados atendem a pelo menos uma das expressões de filtragem no grupo

Para ver exemplos, consulte Enviar uma consulta e incluir filtros (Recuperar) e Enviar uma consulta e incluir filtros (RetrieveAndGenerate).

O Amazon Bedrock Knowledge Base gera e aplica um filtro de recuperação com base na consulta do usuário e em um esquema de metadados.

nota

Atualmente, o recurso só funciona com Anthropic Claude 3.5 Sonnet.

O implicitFilterConfiguration é especificado no vectorSearchConfiguration do Retrievecorpo da solicitação. Inclua os seguintes campos:

metadataAttributes— Nessa matriz, forneça esquemas descrevendo atributos de metadados para os quais o modelo gerará um filtro.
modelArn— O ARN do modelo a ser usado.

Veja a seguir um exemplo de esquemas de metadados que você pode adicionar à matriz. metadataAttributes


[
    {
        "key": "company",
        "type": "STRING",
        "description": "The full name of the company. E.g. `Amazon.com, Inc.`, `Alphabet Inc.`, etc"
    },
    {
        "key": "ticker",
        "type": "STRING",
        "description": "The ticker name of a company in the stock market, e.g. AMZN, AAPL"
    },
    {
        "key": "pe_ratio",
        "type": "NUMBER",
        "description": "The price to earning ratio of the company. This is a measure of valuation of a company. The lower the pe ratio, the company stock is considered chearper."
    },
    {
        "key": "is_us_company",
        "type": "BOOLEAN",
        "description": "Indicates whether the company is a US company."
    },
    {
        "key": "tags",
        "type": "STRING_LIST",
        "description": "Tags of the company, indicating its main business. E.g. `E-commerce`, `Search engine`, `Artificial intelligence`, `Cloud computing`, etc"
    }
]

Você pode implementar barreiras para a base de conhecimento nos casos de uso e políticas de IA responsável. Você pode criar várias barreiras de proteção personalizadas para diferentes casos de uso e aplicá-las em várias condições de solicitação e resposta, proporcionando uma experiência do usuário consistente e padronizando controles de segurança em toda a base de conhecimento. Você pode configurar tópicos negados para evitar tópicos indesejáveis e filtros de conteúdo para bloquear conteúdo prejudicial em entradas e respostas do modelo. Para obter mais informações, consulte Impedir conteúdo prejudicial em modelos usando o Amazon Bedrock Guardrails.

nota

Não é possível usar barreiras de proteção com base contextual para bases de conhecimento no Claude 3 Sonnet e no Haiku.

Para obter diretrizes gerais de engenharia de prompts, consulte Conceitos de engenharia de prompts.

Escolha a guia do seu método preferido e siga as etapas:

Você pode usar um modelo de reclassificação para reclassificar os resultados da consulta da base de conhecimento. Siga as etapas do console em Consulte uma base de conhecimento e recupere dados ouConsulte uma base de conhecimento e gere respostas com base nos dados recuperados. Ao abrir o painel Configurações, expanda a seção Reclassificação. Selecione um modelo de reclassificação, atualize as permissões, se necessário, e modifique as opções adicionais. Insira um prompt e selecione Executar para testar os resultados após a nova classificação.

Decomposição da consulta é uma técnica usada para dividir consultas complexas em subconsultas menores, mais gerenciáveis. Essa abordagem pode ajudar a recuperar informações mais precisas e relevantes, especialmente quando a consulta inicial é multifacetada ou muito abrangente. A habilitação dessa opção pode acarretar a execução de várias consultas na Base de Conhecimento, o que pode ajudar em uma resposta final mais precisa.

Por exemplo, para uma pergunta como “Quem fez mais gols na Copa do Mundo FIFA de 2022, Argentina ou França?”, as bases de conhecimento do Amazon Bedrock podem primeiro gerar as seguintes subconsultas, antes de gerar uma resposta final:

Quantos gols a Argentina fez na final da Copa do Mundo FIFA de 2022?
Quantos gols a França fez na final da Copa do Mundo FIFA de 2022?

Ao gerar respostas com base na recuperação de informações, você pode usar parâmetros de inferência para obter mais controle sobre o comportamento do modelo durante a inferência e influenciar as saídas do modelo.

Para saber como modificar os parâmetros de inferência, escolha a guia do seu método preferido e siga as etapas:

Console

Para modificar os parâmetros de inferência ao consultar uma base de conhecimento, siga as etapas do console em Consulte uma base de conhecimento e recupere dados ou. Consulte uma base de conhecimento e gere respostas com base nos dados recuperados Ao abrir o painel Configurações, você verá uma seção Parâmetros de inferência. Modifique os parâmetros conforme necessário.

Para modificar os parâmetros de inferência ao conversar com o documento: siga as etapas em Conversar com seu documento sem uma base de conhecimento configurada. No painel Configurações, expanda a seção Parâmetros de inferência e modifique os parâmetros conforme necessário.

API

Você fornece os parâmetros do modelo na chamada para o RetrieveAndGenerateAPI. Você pode personalizar o modelo fornecendo parâmetros de inferência no campo inferenceConfig de knowledgeBaseConfiguration (se você consultar uma base de conhecimento) ou de externalSourcesConfiguration (se você conversar com seu documento).

Dentro do campo inferenceConfig, há um campo textInferenceConfig que contém os seguintes parâmetros:

temperature
topP
maxTokenCount
stopSequences

Você pode personalizar o modelo usando os seguintes parâmetros no campo inferenceConfig de externalSourcesConfiguration e knowledgeBaseConfiguration:

temperature
topP
maxTokenCount
stopSequences

Para obter uma explicação detalhada da função de cada um desses parâmetros, consulte Geração de resposta de influência com parâmetros de inferência..

Além disso, você pode fornecer parâmetros personalizados não compatíveis com textInferenceConfig por meio do mapa additionalModelRequestFields. Você pode fornecer parâmetros exclusivos para modelos específicos com esse argumento. Para os parâmetros exclusivos, consulte Parâmetros de solicitação de inferência e campos de resposta para modelos de base.

Se um parâmetro for omitido de textInferenceConfig, um valor padrão será usado. Todos os parâmetros não reconhecidos em textInferneceConfig serão ignorados, ao passo que todos os parâmetros não reconhecidos em AdditionalModelRequestFields causarão uma exceção.

Uma exceção de validação será lançada se houver o mesmo parâmetro em additionalModelRequestFields e TextInferenceConfig.

Usando parâmetros do modelo em RetrieveAndGenerate

Este é um exemplo da estrutura para inferenceConfig e additionalModelRequestFields em generationConfiguration no corpo da solicitação RetrieveAndGenerate:


"inferenceConfig": {
    "textInferenceConfig": {
        "temperature": 0.5,  
        "topP": 0.5,
        "maxTokens": 2048,
        "stopSequences": ["\nObservation"]
    }
},
"additionalModelRequestFields": {
    "top_k": 50
}

O exemplo a seguir vai definir uma temperature de 0,5, top_p de 0,5, maxTokens de 2048, interromper a geração se encontrar a string “\nObservation” na resposta gerada e passa um valor top_k personalizado de 50.

Quando você consulta uma base de conhecimento e solicita a geração de respostas, o Amazon Bedrock usa um modelo de solicitação que combina instruções e contexto com a consulta do usuário para criar a solicitação de geração que é enviada ao modelo para geração de resposta. Você também pode personalizar o prompt de orquestração, que transforma o prompt do usuário em uma consulta de pesquisa. Você pode criar os modelos de prompt com as seguintes ferramentas:

Espaços reservados de prompt: variáveis predefinidas nas bases de conhecimento do Amazon Bedrock preenchidas dinamicamente em tempo de execução durante a consulta à base de conhecimento. No prompt do sistema, você verá esses espaços reservados entre o símbolo $. A seguinte lista descreve os espaços reservados que você pode usar:

nota

O $output_format_instructions$ espaço reservado é um campo obrigatório para que as citações sejam exibidas na resposta.

Variável	Modelo de prompt	Substituído por	Modelo	Obrigatório?
$query$	Orquestração, geração	A consulta do usuário enviada para a base de conhecimento.	Anthropic Claude Instant, Anthropic Claude v2.x	Sim
$query$	Orquestração, geração	A consulta do usuário enviada para a base de conhecimento.	Anthropic Claude 3 Sonnet	Não (incluído automaticamente na entrada do modelo)
$search_results$	Geração	Os resultados recuperados para a consulta do usuário.	Todos	Sim
$output_format_instructions$	Orquestração	Instruções subjacentes para formatação da geração de respostas e citações. Difere de modelo para modelo. Se você definir suas próprias instruções de formatação, sugerimos que remova esse espaço reservado. Sem esse espaço reservado, a resposta não conterá citações.	Todos	Sim
$current_time$	Orquestração, geração	A hora atual.	Todos	Não

Tags XML — Anthropic os modelos suportam o uso de tags XML para estruturar e delinear seus prompts. Use nomes de tags descritivos para obter os resultados ideais. Por exemplo, no prompt do sistema padrão, você verá a tag <database> usada para delinear um banco de dados de perguntas feitas anteriormente. Para obter mais informações, consulte Usar marcas XML no Anthropic guia do usuário.

Para obter diretrizes gerais de engenharia de prompts, consulte Conceitos de engenharia de prompts.

Escolha a guia do seu método preferido e siga as etapas:

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Consulte uma base de conhecimento conectada a um índice Amazon Kendra GenAI

Configurar respostas para modelos de raciocínio