Como o Amazon Bedrock Agents funciona - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como o Amazon Bedrock Agents funciona

O Amazon Bedrock Agents consiste nos dois conjuntos principais de API operações a seguir para ajudá-lo a configurar e administrar um agente:

Configuração em tempo de construção

Um agente consiste nos seguintes componentes:

  • Modelo básico — Você escolhe um modelo básico (FM) que o agente invoca para interpretar a entrada do usuário e as solicitações subsequentes em seu processo de orquestração. O agente também invoca o FM para gerar respostas e etapas de acompanhamento em seu processo.

  • Instruções — Você escreve instruções que descrevem o que o agente foi projetado para fazer. Com os prompts avançados, você pode personalizar ainda mais as instruções para o agente em cada etapa da orquestração e incluir funções do Lambda para analisar a saída de cada etapa.

  • Pelo menos um dos seguintes:

    • Grupos de ações — Você define as ações que o agente deve realizar para o usuário fornecendo os seguintes recursos:

      • Um dos esquemas a seguir para definir os parâmetros que o agente precisa extrair do usuário (cada grupo de ação pode usar um esquema diferente):

        • Uma OpenAPI esquema para definir API as operações que o agente pode invocar para realizar suas tarefas. A ferramenta OpenAPI o esquema inclui os parâmetros que precisam ser extraídos do usuário.

        • Um esquema de detalhes da função para definir os parâmetros que o agente pode extrair do usuário. Esses parâmetros podem então ser usados para orquestração adicional pelo agente, ou você pode configurar como usá-los em seu próprio aplicativo.

      • (Opcional) Uma função Lambda com as seguintes entradas e saídas:

        • Entrada — A API operação e/ou os parâmetros identificados durante a orquestração.

        • Saída — A resposta da API invocação .

    • Bases de conhecimento — Associe as bases de conhecimento a um agente. O agente consulta a base de conhecimento para obter mais contexto para aumentar a geração de respostas e a entrada nas etapas do processo de orquestração.

  • Modelos de solicitação — Os modelos de solicitação são a base para a criação de solicitações a serem fornecidas ao FM. O Amazon Bedrock Agents expõe os quatro modelos de prompt básicos padrão que são usados durante o pré-processamento, a orquestração, a geração de respostas da base de conhecimento e o pós-processamento. Opcionalmente, você pode editar esses modelos básicos de prompt para personalizar o comportamento do seu agente em cada etapa da sequência. Você também pode desativar as etapas para fins de solução de problemas ou se decidir que uma etapa é desnecessária. Para obter mais informações, consulte Aumente a precisão do agente usando modelos de solicitação avançados no Amazon Bedrock.

No momento da construção, todos esses componentes são reunidos para criar prompts básicos para que o agente execute a orquestração até que a solicitação do usuário seja concluída. Com os prompts avançados, você pode modificar esses prompts básicos com lógica adicional e exemplos de poucas tentativas para melhorar a precisão de cada etapa da invocação do agente. Os modelos básicos de prompt contêm instruções, descrições de ações, descrições da base de conhecimento e histórico de conversas, todos os quais você pode personalizar para modificar o agente de acordo com suas necessidades. Em seguida, você prepara seu agente, que empacota todos os componentes dos agentes, incluindo configurações de segurança. A preparação do agente o coloca em um estado em que ele pode ser testado em tempo de execução. A imagem a seguir mostra como as API operações de tempo de construção constroem seu agente.

Como o tempo de construção APIs constrói seu agente. Um grupo de ação consiste em um OpenAPI esquema e uma função Lambda para definir API quais operações um agente pode chamar e como o agente deve lidar com as solicitações e respostas. O agente sintetiza as informações dos modelos básicos de prompt, das instruções fornecidas a ele e de quaisquer grupos de ação e bases de conhecimento anexados para gerar solicitações com o modelo que ele usa. Os prompts são adicionados ao repositório de prompts do agente.

Processo de tempo de execução

O tempo de execução é gerenciado pelo InvokeAgentAPIoperação. Essa operação inicia a sequência do agente, que consiste nas três etapas principais a seguir.

  1. Pré-processamento — gerencia como o agente contextualiza e categoriza a entrada do usuário e pode ser usado para validar a entrada.

  2. Orquestração — interpreta a entrada do usuário, invoca grupos de ação e consulta bases de conhecimento e retorna a saída para o usuário ou como entrada para a orquestração contínua. A orquestração consiste nas seguintes etapas:

    1. O agente interpreta a entrada com um modelo de base e gera uma base racional que define a lógica para a próxima etapa a ser tomada.

    2. O agente prevê qual ação em um grupo de ação ele deve invocar ou qual base de conhecimento ele deve consultar.

    3. Se o agente prevê que precisa invocar uma ação, ele envia os parâmetros, determinados a partir do prompt do usuário, para a função Lambda configurada para o grupo de ação ou retorna o controle enviando os parâmetros no InvokeAgentresposta. Se o agente não tiver informações suficientes para invocar a ação, ele poderá realizar uma das seguintes ações:

      • Consulte uma base de conhecimento associada (geração de resposta da base de conhecimento) para recuperar o contexto adicional e resumir os dados para aumentar sua geração.

      • Solicite novamente que o usuário reúna todos os parâmetros necessários para a ação.

    4. O agente gera uma saída, conhecida como observação, ao invocar uma ação e/ou resumir os resultados de uma base de conhecimento. O agente usa a observação para aumentar o prompt básico, que é então interpretado com um modelo de base. O agente determina se precisa reiterar o processo de orquestração.

    5. Esse loop continua até que o agente retorne uma resposta ao usuário ou até que ele precise solicitar informações adicionais ao usuário.

    Durante a orquestração, o modelo básico de prompt é aumentado com as instruções do agente, os grupos de ação e as bases de conhecimento que você adicionou ao agente. Em seguida, o prompt de base aumentada é usado para invocar o FM. O FM prevê as melhores etapas e trajetórias possíveis para atender às informações do usuário. Em cada iteração da orquestração, o FM prevê a API operação a ser invocada ou a base de conhecimento a ser consultada.

  3. Pós-processamento — O agente formata a resposta final para retornar ao usuário. Esta etapa é desativada por padrão.

Ao invocar seu agente, você pode ativar um rastreamento em tempo de execução. Com o rastreamento, você pode rastrear a lógica, as ações, as consultas e as observações do agente em cada etapa da sequência do agente. O rastreamento inclui a solicitação completa enviada ao modelo básico em cada etapa e os resultados do modelo básico, das API respostas e das consultas da base de conhecimento. Você pode usar o rastreamento para entender o raciocínio do agente em cada etapa. Para ter mais informações, consulte Rastreie o processo de step-by-step raciocínio do agente usando trace

À medida que a sessão do usuário com o agente continua com mais InvokeAgent solicitações, o histórico da conversa é preservado. O histórico de conversas aumenta continuamente o modelo de prompt da base de orquestração com o contexto, ajudando a melhorar a precisão e o desempenho do agente. O diagrama a seguir mostra o processo do agente durante o tempo de execução:

Como seu agente trabalha em tempo de execução. Depois de receber a entrada do usuário, o agente obtém solicitações aumentadas do repositório de prompts e o histórico de conversas do repositório de sessões. Se a etapa de pré-processamento estiver ativada, o agente invoca o FM com a solicitação de pré-processamento para validar a entrada do usuário. Na etapa de orquestração, o agente invoca o FM com o prompt de orquestração e analisa a resposta. Em seguida, ele determina os grupos de ação e consulta as bases de conhecimento conforme necessário e gera uma observação que pode acionar um novo prompt de orquestração. O estágio de orquestração é repetido até que a observação retorne uma resposta final ao usuário.