Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Detalles de los resultados de la prueba en Test Workbench
Los resultados de la prueba muestran los detalles del conjunto de prueba, las intenciones utilizadas y los slots usados. También proporciona el desglose general de las entradas del conjunto de prueba, que incluye los resultados generales, los resultados de la conversación, la intención y los resultados de los slots.
Los resultados de las pruebas incluyen toda la información relacionada con las pruebas, como:
-
Metadatos de detalles de prueba
-
Resultados generales
-
Resultados de la conversación
-
Resultados de intención y slot
-
Resultados detallados
Pestaña de resultados generales:

Desglose de entradas del conjunto de prueba: este gráfico muestra el desglose del número de conversaciones y enunciados de entrada única en el conjunto de prueba.

Desglose de una sola entrada: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.

Desglose de las conversaciones: muestra dos gráficos que incluyen end-to-end conversaciones y transcripciones de voz. El número de entradas aprobadas y fallidas se indica en cada gráfico. Nota: La tabla de transcripción de voz solo estará visible para el conjunto de prueba de audio.
Pestaña de los resultados de la conversación:

Tasas de aprobación de conversaciones: la tabla de tasas de aprobación de conversaciones se utiliza para ver qué intenciones y slots se utilizan en cada conversación del conjunto de pruebas. Para ver dónde ha fallado la conversación, revise qué intención o slot falló, junto con el porcentaje de aprobaciones de cada intento y slot.

Métricas de fallos en la intención de la conversación: esta métrica muestra las cinco intenciones con peor rendimiento del conjunto de prueba. En este panel se muestra un gráfico con el porcentaje o el número de intenciones que tuvieron éxito o fallaron, en función de los registros de conversaciones o de la transcripción del bot. Una intención exitosa no significa que toda la conversación haya sido un éxito. Estas métricas solo se aplican al valor de las intenciones, independientemente de la intención anterior o posterior.

Métricas de fallos en el slot de la conversación: esta métrica muestra los cinco slots con peor rendimiento del conjunto de prueba. Indicó la tasa de éxito de cada slot de la intención. El gráfico de barras muestra tanto la transcripción del discurso como end-to-end las conversaciones para cada espacio de la intención.
Pestaña de resultados de intención y slot:

Métricas de reconocimiento de intenciones: muestra una tabla de cuántas intenciones se reconocieron correctamente. Muestra la tasa de aprobación de la transcripción del discurso y de end-to-end las conversaciones.

Métricas de resolución de slots: muestra las intenciones y los slots por separado, así como la tasa de éxito y fracaso de cada slot para cada intención utilizada en la conversación o en una sola entrada. Muestra la tasa de aprobación de la transcripción de voz y end-to-end las conversaciones.
Pestaña de resultados detallados:

Resultados detallados: muestra una tabla detallada en el registro de conversaciones con los enunciados del usuario y el agente, así como el resultado esperado y la transcripción prevista para cada slot. Puede descargar este informe pulsando el botón Descargar.
En la siguiente tabla se enumeran los mensajes de error de fallos de resultados con escenarios.
Escenario | Mensaje de error | Acción |
---|---|---|
Discrepancia de intenciones | BookFlight Intención esperada, pero era BookHotel intención. | Sáltese otros turnos de la conversación |
Discrepancia en la obtención de slots | Se esperaba que se abriera el slot FechaDeSalida, pero era TipoDeCabina. | Sáltese otros turnos de la conversación |
Discrepancia en el valor del slot | Discrepancia entre el valor esperado y el real de los slots. | Continúe con los demás turnos de las conversaciones |
Back-to-back falta el aviso del agente | Se esperaba que el bot devolviera un mensaje de agente en este turno, pero no lo recibió. | Sáltese otros turnos de la conversación |
Discrepancia en la transcripción | La transcripción esperada no coincidía con la transcripción real. | Continúe con los demás turnos de las conversaciones |
No se ha obtenido el slot opcional | Se espera que aparezca el slot TipoDeCabina en el siguiente turno, sin embargo, la intención actual se cumplió antes de eso. | Sáltese otros turnos de la conversación |
Slot no reconocido | El slot esperado FechaDeSalida no se reconoció en este turno. | Sáltese otros turnos de la conversación |
Aviso adicional para back-to-back el agente | Se esperaba un turno de usuario, pero fue un aviso del agente | Sáltese otros turnos de la conversación |