Funcionamiento de los agentes de Amazon Bedrock - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Funcionamiento de los agentes de Amazon Bedrock

Amazon Bedrock Agents consta de los dos conjuntos principales de API operaciones siguientes para ayudarle a configurar y administrar un agente:

Configuración en tiempo de compilación

Un agente está formado por los siguientes componentes:

  • Modelo fundacional: usted elige un modelo fundacional (FM) que el agente invoca para interpretar las entradas del usuario y las peticiones posteriores en su proceso de orquestación. El agente también invoca el FM para generar respuestas y realizar un seguimiento de los pasos del proceso.

  • Instrucciones: redacta instrucciones que describen para qué se ha diseñado el agente. Las peticiones avanzadas le permiten personalizar aún más las instrucciones para el agente en cada paso de la orquestación e incluir funciones de Lambda para analizar el resultado de cada paso.

  • Al menos una de las siguientes opciones:

    • Grupos de acciones: usted define las acciones que el agente debería llevar a cabo para el usuario al proporcionar los siguientes recursos:

      • Uno de los siguientes esquemas para definir los parámetros que el agente debe obtener del usuario (cada grupo de acciones puede usar un esquema diferente):

        • Un registro OpenAPI esquema para definir las API operaciones que el agente puede invocar para realizar sus tareas. La OpenAPI el esquema incluye los parámetros que se deben obtener del usuario.

        • Un esquema detallado de funciones para definir los parámetros que el agente puede obtener del usuario. A continuación, el agente puede usar estos parámetros para una mayor orquestación o puede configurar cómo usarlos en su propia aplicación.

      • (Opcional) Una función de Lambda con las siguientes entradas y salidas:

        • Entrada: la API operación o los parámetros identificados durante la orquestación.

        • Salida: la respuesta de la API invocación o la respuesta de la invocación de la función.

    • Bases de conocimiento: asocie las bases de conocimiento con un agente. El agente consulta la base de conocimientos para obtener más contexto con el fin de aumentar la generación de respuestas y las entradas en las etapas del proceso de orquestación.

  • Plantillas de peticiones: las plantillas de peticiones son la base para crear las peticiones que se enviarán al FM. Los agentes de Amazon Bedrock exponen las cuatro plantillas de peticiones de base predeterminadas que se utilizan durante el preprocesamiento, la orquestación, la generación de respuestas a la base de conocimientos y el posprocesamiento. De forma opcional, puede editar estas plantillas de peticiones básicas para personalizar el comportamiento del agente en cada paso de su secuencia. También puede desactivar los pasos para la resolución de problemas o si decide que un paso no es necesario. Para obtener más información, consulte Mejora de la precisión del agente con plantillas de peticiones avanzadas en Amazon Bedrock.

En el momento de la compilación, todos estos componentes se recopilan para crear peticiones básicas para el agente con el fin de llevar a cabo la orquestación hasta que se complete la solicitud del usuario. Con las peticiones avanzadas, puede modificar estas instrucciones básicas con lógica adicional y algunos ejemplos con pocos pasos para mejorar la precisión de cada etapa de la invocación del agente. Las plantillas de peticiones básicas contienen instrucciones, descripciones de acciones, descripciones de la base de conocimientos e historial de conversaciones. Todo esto se puede personalizar para modificar el agente según sus necesidades. A continuación, debe preparar el agente, que agrupa todos los componentes de los agentes, incluidas las configuraciones de seguridad. Al preparar al agente, este pasa a un estado en el que se puede probar en tiempo de ejecución. La siguiente imagen muestra cómo las API operaciones en tiempo de compilación construyen su agente.

Cómo construir su agente en el tiempo de construcciónAPIs. Un grupo de acción está formado por un OpenAPI esquema y una función Lambda para definir a qué API operaciones puede llamar un agente y cómo debe gestionar las solicitudes y respuestas. El agente resume la información de las plantillas de peticiones básicas, las instrucciones que se le proporcionan y los grupos de acciones y bases de conocimientos asociados para generar peticiones con el modelo que utiliza. Las peticiones se añaden al almacén de peticiones del agente.

Proceso en tiempo de ejecución

El tiempo de ejecución lo gestiona el InvokeAgentAPIoperación. Esta operación inicia la secuencia del agente, que consta de los siguientes tres pasos principales.

  1. Preprocesamiento: administra la forma en que el agente contextualiza y clasifica las entradas del usuario y si las entradas son válidas.

  2. Orquestación: interpreta la entrada del usuario, invoca grupos de acciones y consulta las bases de conocimientos, además de devolver el resultado al usuario o como entrada para realizar una orquestación continua. La orquestación consta de los siguientes pasos:

    1. El agente interpreta la entrada con un modelo fundacional y genera una justificación que establece la lógica del siguiente paso que debe dar.

    2. El agente predice qué acción de un grupo de acciones debe invocar o qué base de conocimientos debe consultar.

    3. Si el agente predice que necesita invocar una acción, envía los parámetros, determinados a partir de la solicitud del usuario, a la función Lambda configurada para el grupo de acciones o devuelve el control enviando los parámetros del InvokeAgentrespuesta. Si el agente no tiene suficiente información para invocar la acción, puede realizar una de las siguientes acciones:

      • Consultar una base de conocimientos asociada (Generación de respuestas de la base de conocimientos) para obtener contexto adicional y resumir los datos para aumentar su generación.

      • Volver a solicitar al usuario que recopile todos los parámetros necesarios para la acción.

    4. El agente genera un resultado, conocido como observación, al invocar una acción y resumir los resultados de una base de conocimientos. El agente utiliza la observación para aumentar la petición de base, que luego se interpreta con un modelo fundacional. A continuación, el agente determina si necesita reiterar el proceso de orquestación.

    5. Este ciclo continúa hasta que el agente devuelve una respuesta al usuario o hasta que necesite pedirle información adicional al usuario.

    Durante la orquestación, la plantilla de peticiones básicas se amplía con las instrucciones del agente, los grupos de acciones y las bases de conocimientos que haya agregado al agente. A continuación, se utiliza la petición básica aumentada para invocar el FM. El FM predice los mejores pasos y la mejor trayectoria posibles para cumplir con las indicaciones del usuario. En cada iteración de la orquestación, el FM predice la API operación que se va a invocar o la base de conocimientos que se va a consultar.

  3. Procesamiento posterior: el agente formatea la respuesta final para devolverla al usuario. Este paso está desactivado de forma predeterminada.

Al invocar al agente, puede activar el rastreo en tiempo de ejecución. Puede rastrear los razonamientos, las acciones, las consultas y las observaciones del agente en cada paso de la secuencia del agente. El seguimiento incluye el mensaje completo que se envía al modelo básico en cada paso y los resultados del modelo básico, API las respuestas y las consultas de la base de conocimientos. Puede utilizar el rastreo para comprender el razonamiento del agente en cada paso. Para obtener más información, consulte Realice un seguimiento del proceso de step-by-step razonamiento del agente mediante trace.

A medida que la sesión del usuario con el agente continúa con más solicitudes de InvokeAgent, se conserva el historial de conversaciones. El historial de conversaciones aumenta continuamente la plantilla de peticiones de orquestación básicas con el contexto, lo que ayuda a mejorar la precisión y el rendimiento del agente. En el siguiente diagrama se muestra el proceso del agente durante el tiempo de ejecución:

Funcionamiento del agente en tiempo de ejecución. Tras recibir las indicaciones del usuario, el agente busca las peticiones aumentadas del almacén de peticiones y el historial de conversaciones en el almacén de sesiones. Si el paso de preprocesamiento está habilitado, el agente invoca el FM con la petición de preprocesamiento para validar la entrada del usuario. En el paso de orquestación, el agente invoca el FM con la petición de orquestación y analiza la respuesta. A continuación, determina los grupos de acciones y consulta las bases de conocimiento según sea necesario y genera una observación que podría desencadenar una nueva petición de orquestación. La etapa de orquestación entra en bucle hasta que la observación devuelva una respuesta final al usuario.