Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
SynthesizeSpeech
Mensintesis input UTF-8, teks biasa atau SSML, ke aliran byte. Masukan SSML harus valid, SSML yang terbentuk dengan baik. Beberapa huruf mungkin tidak tersedia dengan semua suara (misalnya, Cyrillic mungkin tidak dibaca sama sekali oleh suara bahasa Inggris) kecuali pemetaan fonem digunakan. Untuk informasi selengkapnya, lihat Cara Kerjanya.
Minta Sintaks
POST /v1/speech HTTP/1.1
Content-type: application/json
{
"Engine": "string
",
"LanguageCode": "string
",
"LexiconNames": [ "string
" ],
"OutputFormat": "string
",
"SampleRate": "string
",
"SpeechMarkTypes": [ "string
" ],
"Text": "string
",
"TextType": "string
",
"VoiceId": "string
"
}
Parameter Permintaan URI
Permintaan tidak menggunakan parameter URI apa pun.
Isi Permintaan
Permintaan menerima data berikut dalam format JSON.
- Engine
-
Menentukan mesin (
standard
,,neural
long-form
, ataugenerative
) untuk Amazon Polly untuk digunakan saat memproses teks input untuk sintesis ucapan. Sediakan mesin yang didukung oleh suara yang Anda pilih. Jika Anda tidak menyediakan mesin, mesin standar dipilih secara default. Jika suara yang dipilih tidak didukung oleh mesin standar, ini akan mengakibatkan kesalahan. Untuk informasi tentang suara Amazon Polly dan suara mana yang tersedia untuk setiap mesin, lihat Suara yang Tersedia.Jenis: String
Nilai yang valid:
standard
|neural
|long-form
|generative
Wajib: Ya
Tipe: String
Nilai yang Valid:
standard | neural | long-form | generative
Wajib: Tidak
- LanguageCode
-
Kode bahasa opsional untuk permintaan Synthesize Speech. Ini hanya diperlukan jika menggunakan suara bilingual, seperti Aditi, yang dapat digunakan untuk bahasa Inggris India (En-in) atau Hindi (Hi-in).
Jika suara dwibahasa digunakan dan tidak ada kode bahasa yang ditentukan, Amazon Polly menggunakan bahasa default suara dwibahasa. Bahasa default untuk suara apa pun adalah yang dikembalikan oleh DescribeVoicesoperasi untuk
LanguageCode
parameter. Misalnya, jika tidak ada kode bahasa yang ditentukan, Aditi akan menggunakan bahasa Inggris India daripada bahasa Hindi.Jenis: String
Nilai yang Valid:
arb | cmn-CN | cy-GB | da-DK | de-DE | en-AU | en-GB | en-GB-WLS | en-IN | en-US | es-ES | es-MX | es-US | fr-CA | fr-FR | is-IS | it-IT | ja-JP | hi-IN | ko-KR | nb-NO | nl-NL | pl-PL | pt-BR | pt-PT | ro-RO | ru-RU | sv-SE | tr-TR | en-NZ | en-ZA | ca-ES | de-AT | yue-CN | ar-AE | fi-FI | en-IE | nl-BE | fr-BE
Wajib: Tidak
- LexiconNames
-
Daftar satu atau lebih nama leksikon pengucapan yang Anda inginkan untuk diterapkan layanan selama sintesis. Leksikon diterapkan hanya jika bahasa leksikon sama dengan bahasa suara. Untuk informasi tentang menyimpan leksikon, lihat PutLexicon.
Tipe: Array string
Anggota Array: Jumlah maksimum 5 item.
Pola:
[0-9A-Za-z]{1,20}
Wajib: Tidak
- OutputFormat
-
Format di mana output yang dikembalikan akan dikodekan. Untuk streaming audio, ini akan menjadi mp3, ogg_vorbis, atau pcm. Untuk tanda bicara, ini akan menjadi json.
Saat pcm digunakan, konten yang dikembalikan adalah audio/pcm dalam format 16-bit, 1 saluran (mono), endian kecil yang ditandatangani.
Jenis: String
Nilai yang Valid:
json | mp3 | ogg_vorbis | pcm
Wajib: Ya
- SampleRate
-
Frekuensi audio yang ditentukan dalam Hz.
Nilai yang valid untuk mp3 dan ogg_vorbis adalah “8000", “16000", “22050", dan “24000". Nilai default untuk suara standar adalah “22050". Nilai default untuk suara saraf adalah “24000". Nilai default untuk suara bentuk panjang adalah “24000". Nilai default untuk suara generatif adalah “24000".
Nilai yang valid untuk pcm adalah “8000" dan “16000" Nilai default adalah “16000".
Tipe: String
Wajib: Tidak
- SpeechMarkTypes
-
Jenis tanda bicara yang dikembalikan untuk teks input.
Tipe: Array string
Anggota Array: Jumlah maksimum 4 item.
Nilai yang Valid:
sentence | ssml | viseme | word
Wajib: Tidak
- Text
-
Masukan teks untuk mensintesis. Jika Anda menentukan
ssml
sebagaiTextType
, ikuti format SSML untuk teks input.Tipe: String
Diperlukan: Ya
- TextType
-
Menentukan apakah teks input adalah teks biasa atau SSML. Nilai defaultnya adalah teks biasa. Untuk informasi selengkapnya, lihat Menggunakan SSML.
Jenis: String
Nilai yang Valid:
ssml | text
Wajib: Tidak
- VoiceId
-
ID suara untuk digunakan untuk sintesis. Anda bisa mendapatkan daftar ID suara yang tersedia dengan memanggil DescribeVoicesoperasi.
Jenis: String
Nilai yang Valid:
Aditi | Amy | Astrid | Bianca | Brian | Camila | Carla | Carmen | Celine | Chantal | Conchita | Cristiano | Dora | Emma | Enrique | Ewa | Filiz | Gabrielle | Geraint | Giorgio | Gwyneth | Hans | Ines | Ivy | Jacek | Jan | Joanna | Joey | Justin | Karl | Kendra | Kevin | Kimberly | Lea | Liv | Lotte | Lucia | Lupe | Mads | Maja | Marlene | Mathieu | Matthew | Maxim | Mia | Miguel | Mizuki | Naja | Nicole | Olivia | Penelope | Raveena | Ricardo | Ruben | Russell | Salli | Seoyeon | Takumi | Tatyana | Vicki | Vitoria | Zeina | Zhiyu | Aria | Ayanda | Arlet | Hannah | Arthur | Daniel | Liam | Pedro | Kajal | Hiujin | Laura | Elin | Ida | Suvi | Ola | Hala | Andres | Sergio | Remi | Adriano | Thiago | Ruth | Stephen | Kazuha | Tomoko | Niamh | Sofie | Lisa | Isabelle | Zayd | Danielle | Gregory | Burcu
Wajib: Ya
Sintaksis Respons
HTTP/1.1 200
Content-Type: ContentType
x-amzn-RequestCharacters: RequestCharacters
AudioStream
Elemen Respons
Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.
Respons mengembalikan header HTTP berikut.
- ContentType
-
Menentukan jenis aliran audio. Ini harus mencerminkan
OutputFormat
parameter dalam permintaan Anda.-
Jika Anda meminta
mp3
sebagaiOutputFormat
, yangContentType
dikembalikan adalah audio/mpeg. -
Jika Anda meminta
ogg_vorbis
sebagaiOutputFormat
, yangContentType
dikembalikan adalah audio/ogg. -
Jika Anda meminta
pcm
sebagaiOutputFormat
, yangContentType
dikembalikan adalah audio/pcm dalam format 16-bit, 1 saluran (mono), endian kecil yang ditandatangani. -
Jika Anda meminta
json
sebagaiOutputFormat
, yangContentType
dikembalikan adalah aplikasi/x-json-stream.
-
- RequestCharacters
-
Jumlah karakter yang disintesis.
Respons mengembalikan yang berikut sebagai isi HTTP.
- AudioStream
-
Aliran yang berisi pidato yang disintesis.
Kesalahan
- EngineNotSupportedException
-
Mesin ini tidak kompatibel dengan suara yang Anda tunjuk. Pilih suara baru yang kompatibel dengan mesin atau ganti mesin dan nyalakan kembali operasi.
Kode Status HTTP: 400
- InvalidSampleRateException
-
Tingkat sampel yang ditentukan tidak valid.
Kode Status HTTP: 400
- InvalidSsmlException
-
SSML yang Anda berikan tidak valid. Verifikasi sintaks SSML, ejaan tag dan nilai, lalu coba lagi.
Kode Status HTTP: 400
- LanguageNotSupportedException
-
Bahasa yang ditentukan saat ini tidak didukung oleh Amazon Polly dalam kapasitas ini.
Kode Status HTTP: 400
- LexiconNotFoundException
-
Amazon Polly tidak dapat menemukan leksikon yang ditentukan. Ini bisa disebabkan oleh leksikon yang hilang, namanya salah eja atau menentukan leksikon yang ada di wilayah berbeda.
Verifikasi bahwa leksikon ada, ada di wilayah (lihatListLexicons) dan Anda mengeja namanya dieja dengan benar. Kemudian coba lagi.
Kode Status HTTP: 404
- MarksNotSupportedForFormatException
-
Tanda ucapan tidak didukung untuk yang
OutputFormat
dipilih. Tanda ucapan hanya tersedia untuk konten dalamjson
format.Kode Status HTTP: 400
- ServiceFailureException
-
Kondisi yang tidak diketahui telah menyebabkan kegagalan layanan.
Kode Status HTTP: 500
- SsmlMarksNotSupportedForTextTypeException
-
Tanda ucapan SSML tidak didukung untuk input tipe teks biasa.
Kode Status HTTP: 400
- TextLengthExceededException
-
Nilai parameter “Teks” lebih panjang dari batas yang diterima. Untuk
SynthesizeSpeech
API, batas untuk teks input adalah maksimum 6000 karakter total, yang tidak lebih dari 3000 karakter dapat ditagih. UntukStartSpeechSynthesisTask
API, maksimum adalah 200.000 karakter, yang tidak lebih dari 100.000 karakter dapat ditagih. Tag SSML tidak dihitung sebagai karakter yang ditagih.Kode Status HTTP: 400
Lihat Juga
Untuk informasi selengkapnya tentang penggunaan API ini di salah satu AWS SDK khusus bahasa, lihat berikut ini: