Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Synchronisation de la vitesse d'une voix

Mode de mise au point
Synchronisation de la vitesse d'une voix - Amazon Polly

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

En raison de la variation naturelle entre les voix, chaque voix disponible parle à des vitesses légèrement différentes. Par exemple, avec les voix en anglais américain, Ivy et Joanna sont légèrement plus rapides que Matthew, et considérablement plus rapides que Joey. Comme il existe de nombreuses variations entre les voix, aucune vitesse standard (mots par minute) n'est disponible pour les voix Amazon Polly. Cependant, vous pouvez savoir combien de temps il faut à votre voix pour prononcer le texte sélectionné à l'aide des marques vocales.

Pour chronométrer la longueur d'un passage de texte oral
  1. Ouvrez le AWS CLI.

  2. Exécutez le code suivant, en le complétant si nécessaire.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Ouvrir LengthOfText.txt.

Si le texte était « Mary avait un petit agneau », les dernières lignes renvoyées par Amazon Polly seraient les suivantes :

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

Le dernier visème, essentiellement le son des dernières lettres de « lamb » démarre 1 082 millisecondes après le début de la phrase. Bien que ce ne soit pas exactement la longueur de l'audio, elle est assez proche et peut être utilisée comme base pour la comparaison entre les voix.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.