As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
SynthesizeSpeech
Sintetiza a entrada UTF -8, texto simples ouSSML, em um fluxo de bytes. SSMLa entrada deve ser válida e bem formadaSSML. Alguns alfabetos podem não estar disponíveis com todas as vozes (por exemplo, o cirílico pode não ser lido pelas vozes em inglês), a menos que o mapeamento de fonemas seja usado. Para obter mais informações, consulte Como funciona.
Sintaxe da Solicitação
POST /v1/speech HTTP/1.1
Content-type: application/json
{
"Engine": "string
",
"LanguageCode": "string
",
"LexiconNames": [ "string
" ],
"OutputFormat": "string
",
"SampleRate": "string
",
"SpeechMarkTypes": [ "string
" ],
"Text": "string
",
"TextType": "string
",
"VoiceId": "string
"
}
URIParâmetros de solicitação
A solicitação não usa nenhum URI parâmetro.
Corpo da Solicitação
A solicitação aceita os seguintes dados no JSON formato.
- Engine
-
Especifica o mecanismo (
standard
,neural
,long-form
ougenerative
) que o Amazon Polly usará ao processar texto de entrada para a síntese de fala. Forneça um mecanismo compatível com a voz selecionada. Se você não fornecer um mecanismo, será selecionado o mecanismo padrão. Se a voz escolhida não for compatível com o mecanismo padrão, ocorrerá um erro. Para obter informações sobre as vozes do Amazon Polly e quais estão disponíveis para cada mecanismo, consulte Vozes disponíveis.Tipo: string
Valores válidos:
standard
|neural
|long-form
|generative
Obrigatório: Sim
Tipo: String
Valores Válidos:
standard | neural | long-form | generative
Obrigatório: não
- LanguageCode
-
Código de idioma opcional para a solicitação Synthesize Speech. É necessário apenas se estiver usando uma voz bilíngue, como Aditi, que pode ser usada para inglês indiano (en-IN) ou hindi (hi-IN).
Se uma voz bilíngue for usada e nenhum código de idioma for especificado, o Amazon Polly usará o idioma padrão da voz bilíngue. O idioma padrão para qualquer voz é aquele retornado pela DescribeVoicesoperação do
LanguageCode
parâmetro. Por exemplo, se nenhum código de idioma for especificado, Aditi usará inglês indiano em vez de hindi.Tipo: string
Valores Válidos:
arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE | cs-CZ | de-CH
Obrigatório: não
- LexiconNames
-
Lista de um ou mais nomes de léxico de pronúncia que você deseja que o serviço aplique durante a síntese. O léxico só será aplicado ao texto se o idioma especificado nele for o mesmo que o da voz. Para obter informações sobre como armazenar léxicos, consulte. PutLexicon
Tipo: matriz de strings
Membros da matriz: número máximo de 5 itens.
Padrão:
[0-9A-Za-z]{1,20}
Obrigatório: não
- OutputFormat
-
O formato no qual a saída retornada será codificada. Para transmissão de áudio, será MP3, ogg_vorbis ou pcm. Marcas de fala serão JSON.
Quando o pcm for usado, o conteúdo retornado é áudio/pcm em formato little-endian assinado de 16 bits e 1 canal (mono).
Tipo: string
Valores Válidos:
json | mp3 | ogg_vorbis | pcm
Obrigatório: sim
- SampleRate
-
A frequência de áudio especificada em Hz.
Os valores válidos para MP3 e ogg_vorbis são 8000, 16000, 22050 e 24000. O valor padrão para vozes padrão é 22050. O valor padrão para vozes neurais é 24000. O valor padrão para vozes em formato longo é “24.000”. O valor padrão para vozes generativas é “24000”.
Os valores válidos para pcm são 8000 e 16000. O valor padrão é 16000.
Tipo: String
Obrigatório: Não
- SpeechMarkTypes
-
Tipo de marcas de fala retornadas para o texto de entrada.
Tipo: matriz de strings
Membros da matriz: número máximo de 4 itens.
Valores Válidos:
sentence | ssml | viseme | word
Obrigatório: não
- Text
-
Insira texto para sintetizar. Se você especificar
ssml
comoTextType
, siga o SSML formato do texto de entrada.Tipo: string
Obrigatório: Sim
- TextType
-
Especifica se o texto de entrada é texto sem formatação ouSSML. O valor padrão é texto sem formatação. Para obter mais informações, consulte Usar o SSML.
Tipo: string
Valores Válidos:
ssml | text
Obrigatório: não
- VoiceId
-
ID de voz a ser usado para a síntese. Você pode obter uma lista das vozes disponíveis IDs ligando para a DescribeVoicesoperação.
Tipo: string
Valores Válidos:
Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu | Jitka | Sabrina
Exigido: Sim
Sintaxe da Resposta
HTTP/1.1 200
Content-Type: ContentType
x-amzn-RequestCharacters: RequestCharacters
AudioStream
Elementos de Resposta
Se a ação for bem-sucedida, o serviço retornará uma resposta HTTP de 200.
A resposta retorna os seguintes HTTP cabeçalhos.
- ContentType
-
Especifica o tipo de fluxo de áudio. Isso deve refletir o
OutputFormat
parâmetro em sua solicitação.-
Se você solicitar
mp3
como oOutputFormat
, oContentType
retornado será áudio/mpeg. -
Se você solicitar
ogg_vorbis
como oOutputFormat
, oContentType
retornado será audio/ogg. -
Se você solicitar
pcm
como oOutputFormat
, oContentType
retornado será áudio/pcm em um formato little-endian assinado de 16 bits, 1 canal (mono). -
Se você solicitar
json
como oOutputFormat
, oContentType
retornado é application/x-json-stream.
-
- RequestCharacters
-
Número de caracteres sintetizados.
A resposta retorna o seguinte como HTTP corpo.
- AudioStream
-
Fluxo contendo a fala sintetizada.
Erros
- EngineNotSupportedException
-
Esse mecanismo não é compatível com a voz que você designou. Escolha uma nova voz compatível com o mecanismo ou troque-o e reinicie a operação.
HTTPCódigo de status: 400
- InvalidSampleRateException
-
A taxa de amostragem especificada é inválida.
HTTPCódigo de status: 400
- InvalidSsmlException
-
O SSML que você forneceu é inválido. Verifique a SSML sintaxe, a ortografia das tags e valores e tente novamente.
HTTPCódigo de status: 400
- LanguageNotSupportedException
-
O idioma especificado não é compatível com o Amazon Polly nessa capacidade.
HTTPCódigo de status: 400
- LexiconNotFoundException
-
O Amazon Polly não encontrou o léxico especificado. Isso pode ser causado por um léxico inexistente, pelo nome escrito incorretamente ou pela especificação de um léxico que está em uma região diferente.
Verifique se o léxico existe, se está na região (consulte ListLexicons) e se o nome dele está escrito corretamente. Tente novamente.
HTTPCódigo de status: 404
- MarksNotSupportedForFormatException
-
As marcas de fala não são compatíveis com o
OutputFormat
selecionado. As marcas de fala estão disponíveis apenas para conteúdo em formatojson
.HTTPCódigo de status: 400
- ServiceFailureException
-
Uma condição desconhecida causou uma falha no serviço.
HTTPCódigo de status: 500
- SsmlMarksNotSupportedForTextTypeException
-
SSMLmarcas de fala não são suportadas para entrada de texto simples.
HTTPCódigo de status: 400
- TextLengthExceededException
-
O valor do parâmetro Texto é maior que os limites aceitos. Para o
SynthesizeSpeech
API, o limite para o texto de entrada é de no máximo 6.000 caracteres no total, dos quais não mais do que 3.000 podem ser cobrados. Para oStartSpeechSynthesisTask
API, o máximo é de 200.000 caracteres, dos quais não mais do que 100.000 podem ser cobrados. SSMLas tags não são contadas como caracteres cobrados.HTTPCódigo de status: 400
Consulte também
Para obter mais informações sobre como usar isso API em um idioma específico AWS SDKs, consulte o seguinte: