Synchronisation de la vitesse d'une voix

Mode de mise au point

Synchronisation de la vitesse d'une voix - Amazon Polly

En raison de la variation naturelle entre les voix, chaque voix disponible parle à des vitesses légèrement différentes. Par exemple, avec les voix en anglais américain, Ivy et Joanna sont légèrement plus rapides que Matthew, et considérablement plus rapides que Joey. Comme il existe de nombreuses variations entre les voix, aucune vitesse standard (mots par minute) n'est disponible pour les voix Amazon Polly. Cependant, vous pouvez savoir combien de temps il faut à votre voix pour prononcer le texte sélectionné à l'aide des marques vocales.

Pour chronométrer la longueur d'un passage de texte oral

Ouvrez le AWS CLI.

Exécutez le code suivant, en le complétant si nécessaire.


     aws polly synthesize-speech \
          --language-code optional language code if needed
          --output-format json \
          --voice-id [name of desired voice] \
          --text '[desired text]' \
          --speech-mark-types='["viseme"]' \
          LengthOfText.txt

Ouvrir LengthOfText.txt.

Si le texte était « Mary avait un petit agneau », les dernières lignes renvoyées par Amazon Polly seraient les suivantes :


     {"time":882,"type":"viseme","value":"t"}
     {"time":964,"type":"viseme","value":"a"}
     {"time":1082,"type":"viseme","value":"p"}

Le dernier visème, essentiellement le son des dernières lettres de « lamb » démarre 1 082 millisecondes après le début de la phrase. Bien que ce ne soit pas exactement la longueur de l'audio, elle est assez proche et peut être utilisée comme base pour la comparaison entre les voix.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.