Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
SynthesizeSpeech
Synthétise une entrée UTF-8, du texte brut ou SSML dans un flux d'octets. L'entrée SSML doit être un SSML valide et bien formé. Certains alphabets peuvent ne pas être disponibles avec toutes les voix (par exemple, le cyrillique peut ne pas être lu du tout par les voix anglaises) sauf si le mappage des phonèmes est utilisé. Pour plus d'informations, consultez la section Fonctionnement.
Syntaxe de la demande
POST /v1/speech HTTP/1.1
Content-type: application/json
{
"Engine": "string
",
"LanguageCode": "string
",
"LexiconNames": [ "string
" ],
"OutputFormat": "string
",
"SampleRate": "string
",
"SpeechMarkTypes": [ "string
" ],
"Text": "string
",
"TextType": "string
",
"VoiceId": "string
"
}
Paramètres de demande URI
La demande n’utilise pas de paramètres URI.
Corps de la demande
Cette demande accepte les données suivantes au format JSON.
- Engine
-
Spécifie le moteur (
standard
,neural
long-form
, ougenerative
) qu'Amazon Polly doit utiliser lors du traitement du texte d'entrée pour la synthèse vocale. Fournissez un moteur compatible avec la voix que vous sélectionnez. Si vous ne fournissez pas de moteur, le moteur standard est sélectionné par défaut. Si une voix choisie n'est pas prise en charge par le moteur standard, cela provoquera une erreur. Pour plus d'informations sur les voix Amazon Polly et sur les voix disponibles pour chaque moteur, consultez Available Voices.Type : chaîne
Valeurs Valides:
standard
|neural
|long-form
|generative
Obligatoire : oui
Type : String
Valeurs valides :
standard | neural | long-form | generative
Obligatoire : non
- LanguageCode
-
Code de langue facultatif pour la demande Synthesize Speech. Cela n'est nécessaire que si vous utilisez une voix bilingue, telle que Aditi, qui peut être utilisée en anglais indien (en-in) ou en hindi (hi-in).
Si une voix bilingue est utilisée et qu'aucun code de langue n'est spécifié, Amazon Polly utilise la langue par défaut de la voix bilingue. La langue par défaut pour toute voix est celle renvoyée par l'DescribeVoicesopération du
LanguageCode
paramètre. Par exemple, si aucun code de langue n'est spécifié, Aditi utilisera l'anglais indien plutôt que l'hindi.Type : chaîne
Valeurs valides :
arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE
Obligatoire : non
- LexiconNames
-
Liste d'un ou de plusieurs noms de lexiques de prononciation que vous souhaitez que le service applique lors de la synthèse. Les lexiques ne sont appliqués que si la langue du lexique est la même que celle de la voix. Pour plus d'informations sur le stockage des lexiques, consultez PutLexicon.
Type : tableau de chaînes
Membres du tableau : Nombre maximum de 5 éléments.
Modèle :
[0-9A-Za-z]{1,20}
Obligatoire : non
- OutputFormat
-
Format dans lequel la sortie renvoyée sera codée. Pour le flux audio, il s'agira de mp3, ogg_vorbis ou pcm. Pour les marques vocales, il s'agira de json.
Lorsque pcm est utilisé, le contenu renvoyé est audio/pcm au format little-endian 16 bits signé, 1 canal (mono).
Type : chaîne
Valeurs valides :
json | mp3 | ogg_vorbis | pcm
Obligatoire : oui
- SampleRate
-
Fréquence audio spécifiée en Hz.
Les valeurs valides pour mp3 et ogg_vorbis sont « 8000 », « 16000 », « 22050 » et « 24000 ». La valeur par défaut pour les voix standard est « 22050 ». La valeur par défaut pour les voix neuronales est « 24 000 ». La valeur par défaut pour les voix longues est « 24 000 ». La valeur par défaut pour les voix génératives est « 24 000 ».
Les valeurs valides pour pcm sont « 8000 » et « 16000 ». La valeur par défaut est « 16000 ».
Type : chaîne
Obligatoire : non
- SpeechMarkTypes
-
Type de marques vocales renvoyées pour le texte saisi.
Type : tableau de chaînes
Membres du tableau : nombre maximum de 4 éléments.
Valeurs valides :
sentence | ssml | viseme | word
Obligatoire : non
- Text
-
Entrez le texte à synthétiser. Si vous
ssml
le spécifiezTextType
, suivez le format SSML pour le texte d'entrée.Type : chaîne
Obligatoire : oui
- TextType
-
Spécifie si le texte d'entrée est du texte brut ou du SSML. La valeur par défaut est le texte brut. Pour plus d'informations, consultez Utilisation de SSML.
Type : chaîne
Valeurs valides :
ssml | text
Obligatoire : non
- VoiceId
-
Identifiant vocal à utiliser pour la synthèse. Vous pouvez obtenir une liste des identifiants vocaux disponibles en appelant l'DescribeVoicesopération.
Type : chaîne
Valeurs valides :
Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu
Obligatoire : oui
Syntaxe de la réponse
HTTP/1.1 200
Content-Type: ContentType
x-amzn-RequestCharacters: RequestCharacters
AudioStream
Eléments de réponse
Si l’action aboutit, le service renvoie une réponse HTTP 200.
La réponse renvoie les en-têtes HTTP suivants.
- ContentType
-
Spécifie le type de flux audio. Cela doit refléter le
OutputFormat
paramètre de votre demande.-
Si vous le demandez
OutputFormat
,mp3
le résultat estContentType
audio/mpeg. -
Si vous le demandez
OutputFormat
,ogg_vorbis
le résultat estContentType
audio/ogg. -
Si vous le demandez
OutputFormat
,pcm
le résultat estContentType
audio/pcm au format little-endian 16 bits signé, 1 canal (mono). -
Si vous le demandez
json
en tant queOutputFormat
, leContentType
retour est application/x-json-stream.
-
- RequestCharacters
-
Nombre de caractères synthétisés.
La réponse renvoie ce qui suit en tant que corps HTTP.
- AudioStream
-
Stream contenant le discours synthétisé.
Erreurs
- EngineNotSupportedException
-
Ce moteur n'est pas compatible avec la voix que vous avez désignée. Choisissez une nouvelle voix compatible avec le moteur ou changez de moteur et relancez l'opération.
Code d’état HTTP : 400
- InvalidSampleRateException
-
La fréquence d'échantillonnage spécifiée n'est pas valide.
Code d’état HTTP : 400
- InvalidSsmlException
-
Le code SSML que vous avez fourni n'est pas valide. Vérifiez la syntaxe SSML, l'orthographe des balises et des valeurs, puis réessayez.
Code d’état HTTP : 400
- LanguageNotSupportedException
-
La langue spécifiée n'est actuellement pas prise en charge par Amazon Polly à ce titre.
Code d’état HTTP : 400
- LexiconNotFoundException
-
Amazon Polly ne trouve pas le lexique spécifié. Cela peut être dû à un lexique manquant, à une faute d'orthographe de son nom ou à la spécification d'un lexique situé dans une autre région.
Vérifiez que le lexique existe, qu'il se trouve dans la région (voirListLexicons) et que vous avez orthographié son nom correctement. Ensuite, réessayez.
Code d’état HTTP : 404
- MarksNotSupportedForFormatException
-
Les marques vocales ne sont pas prises en charge pour les
OutputFormat
éléments sélectionnés. Les marques vocales ne sont disponibles que pour le contenu aujson
format.Code d’état HTTP : 400
- ServiceFailureException
-
Une situation inconnue a provoqué une panne de service.
Code d’état HTTP : 500
- SsmlMarksNotSupportedForTextTypeException
-
Les marques vocales SSML ne sont pas prises en charge pour la saisie de type texte brut.
Code d’état HTTP : 400
- TextLengthExceededException
-
La valeur du paramètre « Texte » est supérieure aux limites acceptées. Pour l'
SynthesizeSpeech
API, la limite de saisie de texte est de 6 000 caractères au total, dont 3 000 caractères peuvent être facturés au maximum. Pour l'StartSpeechSynthesisTask
API, le maximum est de 200 000 caractères, dont 100 000 caractères peuvent être facturés au maximum. Les balises SSML ne sont pas considérées comme des caractères facturés.Code d’état HTTP : 400
consultez aussi
Pour plus d'informations sur l'utilisation de cette API dans l'un des AWS SDK spécifiques au langage, consultez les pages suivantes :