

# Detalles del agente: evaluaciones
<a name="session-traces-evaluations"></a>

Las evaluaciones proporcionan métricas de supervisión continua de la calidad para agentes de IA. Puede utilizar la información proporcionada por el panel para evaluar el rendimiento, la calidad y la fiabilidad de los agentes de IA. 

En lugar de basarse en casos de prueba simulados, las evaluaciones capturan las sesiones reales de usuarios y las interacciones de los agentes, lo que proporciona una visión completa del rendimiento de los agentes, desde la entrada hasta la salida final. Con las evaluaciones de los agentes, puede definir reglas de muestreo para evaluar solo un porcentaje de las sesiones o rastros y, a continuación, aplicar una variedad de evaluadores para evaluar y puntuar el rendimiento operativo de un agente de IA. Las evaluaciones y puntuaciones resultantes se muestran en el panel Evaluaciones, lo que le permite supervisar las tendencias, identificar posibles problemas de calidad, configurar alarmas e investigar y diagnosticar posibles problemas.

El panel Evaluaciones muestra todas las evaluaciones que se han activado y configurado para el agente seleccionado. Para obtener más información sobre la configuración de las evaluaciones para un agente, consulte [Evaluaciones de AgentCore](https://docs.aws.amazon.com/bedrock-agentcore/latest/devguide/evaluations.html). Puede ampliar cada evaluación para ver las sesiones, los rastros y los periodos que se evaluaron. 

![\[Evaluaciones\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_overview.png)


**Topics**
+ [Detalles de las evaluaciones](#session-traces-evaluations-details)
+ [Gráficos de evaluaciones](#session-traces-evaluations-graphs)
+ [Uso de los resultados de evaluaciones](#session-traces-evaluations-raw-results)

## Detalles de las evaluaciones
<a name="session-traces-evaluations-details"></a>

Para cada evaluación, el panel incluye las siguientes secciones:

------
#### [ Evaluation configuration metrics ]

Proporciona métricas para la configuración de evaluación general. Un evaluador define cómo evaluar un aspecto específico del rendimiento de un agente de IA. Para ver más detalles sobre un evaluador, elija su nombre en la columna **Evaluador**. Para ver un gráfico de barras y analizar las tendencias de un evaluados, elija el valor en la columna **Recuento**.

![\[Métricas de configuración de evaluación\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_01.png)


------
#### [ Session evaluations ]

Proporciona los resultados de la evaluación a los evaluadores por sesión. Una sesión representa una agrupación lógica de interacciones relacionadas de un solo usuario o flujo de trabajo. Una sesión puede contener uno o más rastros. Puede elegir una sesión para filtrarla hasta ver la lista de rastros de esa sesión en la sección **Evaluaciones de rastros**.

![\[Evaluaciones de sesiones\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_02.png)


------
#### [ Trace evaluations ]

Proporciona los resultados de la evaluación a los evaluadores por rastro. Un rastro es un registro completo de la ejecución o solicitud de un solo agente. Un rastro puede contener uno o más intervalos. Elija una rastro para ver los detalles del rastro junto con todos los evaluadores que se ejecutaron en ese rastro.

![\[Evaluaciones de rastros\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_03.png)


------
#### [ Span evaluations ]

Proporciona los resultados de la evaluación a los evaluadores por intervalo. Un intervalo representa las operaciones individuales llevadas a cabo durante esa ejecución. Elija un intervalo para ver sus detalles junto con todas las operaciones llevadas a cabo durante ese intervalo.

![\[Evaluaciones de intervalos\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_04.png)


------

## Gráficos de evaluaciones
<a name="session-traces-evaluations-graphs"></a>

El panel Evaluaciones también incluye un gráfico de barras para cada evaluador. Los gráficos muestran las tendencias de cada evaluador a lo largo del tiempo y permiten configurar alarmas para valores métricos específicos. Para configurar una alarma, haga clic en una barra del gráfico y, a continuación, elija el icono de **alarma** (campana). Para obtener más información, consulte [Uso de las alarmas de Amazon CloudWatch](CloudWatch_Alarms.md).

![\[Gráficos de evaluaciones\]](http://docs.aws.amazon.com/es_es/AmazonCloudWatch/latest/monitoring/images/evals_graphs.png)


## Uso de los resultados de evaluaciones
<a name="session-traces-evaluations-raw-results"></a>

Si necesita acceso directo a los datos de los resultados de evaluaciones, o si desea crear visualizaciones personalizadas o trabajar fuera de la consola de Evaluaciones de AgentCore, puede acceder a los resultados de evaluaciones directamente a través de los paneles de Registros de CloudWatch, Métricas de CloudWatch y CloudWatch.

**Topics**
+ [Acceso a los resultados de evaluaciones en Resultados de CloudWatch](#accessing-evaluation-results-logs)
+ [Acceso a las métricas de evaluaciones en Métricas de CloudWatch](#accessing-evaluation-metrics)
+ [Creación de paneles personalizados](#creating-custom-dashboards)
+ [Configuración de alarmas en métricas de evaluaciones](#setting-alarms-evaluation-metrics)
+ [Recursos adicionales](#additional-resources)

### Acceso a los resultados de evaluaciones en Resultados de CloudWatch
<a name="accessing-evaluation-results-logs"></a>

Los resultados de evaluaciones se publican automáticamente en Registros de CloudWatch en formato de métricas integradas (EMF).

**Buscar el grupo de registro de resultados de evaluaciones**

1. Abra la consola de CloudWatch.

1. En el panel de navegación, elija **Administración de registros** > **Grupos de registro**.

1. Busque los grupos de registro con el prefijo `/aws/bedrock-agentcore/evaluations/` o navegue por ellos.

1. Dentro de este grupo de registro, los eventos de registro contienen los resultados de evaluaciones.

Para obtener más información sobre cómo trabajar con grupos de registros y consultar datos de registro, consulte [Uso de grupos de registro y flujos de registro](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/Working-with-log-groups-and-streams.html) y [Análisis de datos de registros con Información de registros de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/AnalyzingLogData.html).

### Acceso a las métricas de evaluaciones en Métricas de CloudWatch
<a name="accessing-evaluation-metrics"></a>

Las métricas de los resultados de evaluaciones se extraen automáticamente de los registros en formato de métricas integradas (EMF) y se publican en Métricas de CloudWatch.

**Buscar métricas de evaluaciones**

1. Abra la consola de CloudWatch.

1. En el panel de navegación, elija **Métricas** > **Todas las métricas**.

1. Seleccione el espacio de nombres **Bedrock AgentCore/Evaluations**.

1. Explore las métricas disponibles por dimensiones.

Para obtener más información sobre cómo ver las métricas y trabajar con ellas, consulte [Uso de métricas de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/working_with_metrics.html) y [Representación gráfica de las métricas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/graph_metrics.html).

### Creación de paneles personalizados
<a name="creating-custom-dashboards"></a>

Puede crear paneles personalizados para visualizar las métricas de evaluaciones junto con otras métricas operativas.

**Creación de un panel con métricas de evaluaciones**

1. En la consola de CloudWatch, elija **Paneles** en el panel de navegación.

1. Elija **Crear panel**.

1. Agregue widgets y seleccione métricas del espacio de nombres **Bedrock AgentCore/Evaluations**

1. Personalice el intervalo de tiempo, la estadística y el tipo de visualización según sus necesidades.

Para obtener instrucciones detalladas, consulte [Creación de un panel de CloudWatch personalizado](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/create_dashboard.html) y [Uso de paneles de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Dashboards.html).

### Configuración de alarmas en métricas de evaluaciones
<a name="setting-alarms-evaluation-metrics"></a>

Puede configurar alarmas para recibir notificaciones cuando las métricas de evaluaciones superen los umbrales que haya especificado; por ejemplo, cuando la corrección sea inferior a los niveles aceptables.

**Creación de una alarma en métricas de evaluaciones**

1. En la consola de CloudWatch, elija **Alarmas** > **Todas las alarmas**.

1. Elija **Crear alarma**.

1. Elija **Seleccionar métrica** y navegue hasta el espacio de nombres **Bedrock AgentCore/Evaluations**.

1. Seleccione la métrica que quiere supervisar.

1. Configure las condiciones del umbral (el umbral de detección dinámica de anomalías está disponible cuando no es necesario especificar ningún umbral numérico estático) y las acciones de notificación.

Para obtener instrucciones detalladas, consulte [Uso de alarmas de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/CloudWatch_Alarms.html) y [Cree una alarma de CloudWatch basada en un umbral estático](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/ConsoleAlarms.html).

### Recursos adicionales
<a name="additional-resources"></a>
+ [Formato de métricas integradas de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CloudWatch-Logs-Monitoring-CloudWatch-Metrics.html)
+ [Sintaxis de consulta Información de registros de CloudWatch](https://docs.aws.amazon.com/AmazonCloudWatch/latest/logs/CWL_QuerySyntax.html)
+ [Creación de alarmas compuestas](https://docs.aws.amazon.com/AmazonCloudWatch/latest/monitoring/Create_Composite_Alarm.html)