Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Sortie Speech Mark

Mode de mise au point
Sortie Speech Mark - Amazon Polly

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Amazon Polly renvoie les objets de marque vocale dans un flux JSON délimité par des lignes. Chaque objet de marque vocale contient les champs suivants :

  • time — l'horodatage en millisecondes à compter du début du flux audio correspondant

  • type : type de marque vocale (phrase, mot, visème ou ssml)

  • début : décalage en octets (et non en caractères) du début de l'objet dans le texte saisi (sans compter les marques de visème)

  • fin : le décalage en octets (et non en caractères) de la fin de l'objet dans le texte saisi (sans compter les marques de visème)

  • valeur : elle varie en fonction du type de marque vocale

    • SSML : balise SSML <mark>

    • viseme : le nom du visème

    • word ou sentence : sous-chaîne du texte d'entrée, telle que délimitée par les champs de début et de fin

Par exemple, Amazon Polly génère l'objet de marque word vocale suivant à partir du texte « Mary had a little lamb » :

{"time":373,"type":"word","start":5,"end":8,"value":"had"}

Le mot décrit (« had ») commence 373 millisecondes après le début du flux audio à l'octet 5 et se termine à l'octet 8 du texte d'entrée.

Note

Cette métadonnée correspond au voice-id Joanna. Si vous utilisez une autre voix avec le même texte d'entrée, la métadonnée peut être différente.

Rubrique suivante :

Demande de marques vocales

Rubrique précédente :

Visemes et Amazon Polly
ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.