Control de los turnos
Los turnos son un aspecto fundamental de la conversación natural. Amazon Nova 2 Sonic proporciona un control detallado sobre cuándo es el turno de la IA para hablar a través del parámetro turnDetectionConfiguration. Esto le permite optimizar el flujo de la conversación para diferentes casos de uso, lo que equilibra la capacidad de respuesta con la precisión. El parámetro endpointingSensitivity controla la rapidez con la que Amazon Nova 2 Sonic detecta el final del turno de un usuario y comienza a responder. Esta configuración afecta tanto a la latencia de las respuestas como a la probabilidad de interrumpir a los usuarios que siguen hablando.
Configuración de la API
Configure la sensibilidad de la detección de turnos en el evento sessionStart:
{ "event": { "sessionStart": { "inferenceConfiguration": { "maxTokens": 1000, "topP": 0.9, "temperature": 0.7 }, "turnDetectionConfiguration": { "endpointingSensitivity": "HIGH" | "MEDIUM" | "LOW" } } } }
Niveles de sensibilidad
El parámetro endpointingSensitivity acepta tres valores: ALTO, MEDIO y BAJO. Cada nivel equilibra la velocidad de la respuesta con el riesgo de interrumpir a los usuarios que siguen hablando.
- ALTO
-
El tiempo de respuesta más rápido, optimizado para la latencia. Nova Sonic responde lo más rápido posible después de detectar el final del habla. Duración de la pausa: 1,5 segundos. Ideal para preguntas y respuestas rápidas, aplicaciones de comando y control e interacciones urgentes.
- MEDIO
-
Enfoque equilibrado con un tiempo de respuesta moderado. Reduce los falsos positivos a la vez que mantiene la capacidad de respuesta. Duración de la pausa: 1,75 segundos. Ideal para conversaciones generales, servicio de atención al cliente con consultas complejas y conversaciones de varios turnos.
- BAJA
-
El tiempo de respuesta más lento con la máxima paciencia. Nova Sonic espera la mayor cantidad de tiempo antes de responder, lo que minimiza las interrupciones de los usuarios que se detienen mientras piensan. Duración de la pausa: 2 segundos. Ideal para conversaciones reflexivas, usuarios de edad avanzada o con problemas del habla y para resolver problemas complejos.
Referencia de la duración de la pausa
| Nivel de sensibilidad | Duración de la pausa (segundos) |
|---|---|
| Alto (rápido) | 1.5 |
| Medio | 1,75 |
| Bajo (lento) | ~2,0 |