

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# Tipos de marcas de voz
<a name="using-speechmarks"></a>

Las marcas de voz se solicitan mediante la [SpeechMarkTypes](https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisTask.html#polly-StartSpeechSynthesisTask-request-SpeechMarkTypes)opción de los comandos [SynthesizeSpeech](https://docs.aws.amazon.com/polly/latest/dg/API_SynthesizeSpeech.html)o [StartSpeechSynthesisTask](https://docs.aws.amazon.com/polly/latest/dg/API_StartSpeechSynthesisTask.html). Debe especificar los metadatos del texto de entrada que quiere que se devuelvan. Puede solicitar hasta cuatro tipos de metadatos y debe especificar al menos uno en cada solicitud. Esta solicitud no genera ninguna salida de audio.

En AWS CLI, por ejemplo:

```
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
```

Amazon Polly genera las marcas de voz utilizando los siguientes elementos:
+  **sentence**: sirve para señalar frases en el texto de entrada. 
+  **word**: sirve para señalar palabras en el texto. 
+  **viseme**: describe los movimientos de la cara y la boca que corresponden a cada fonema que se pronuncia. Para obtener más información, consulte [Visemas y Amazon Polly](viseme.md). 
+  **ssml** describe un elemento <mark> del texto de entrada SSML. Para obtener más información, consulte [Generación de fragmentos hablados desde documentos SSML](ssml.md).