Minta Sintaks Parameter Permintaan URI Isi Permintaan Sintaksis Respons Elemen Respons Kesalahan Lihat Juga

SynthesizeSpeech

Mensintesis input UTF-8, teks biasa atau SSML, ke aliran byte. Masukan SSML harus valid, SSML yang terbentuk dengan baik. Beberapa huruf mungkin tidak tersedia dengan semua suara (misalnya, Cyrillic mungkin tidak dibaca sama sekali oleh suara bahasa Inggris) kecuali pemetaan fonem digunakan. Untuk informasi selengkapnya, lihat Cara Kerjanya.

Minta Sintaks


POST /v1/speech HTTP/1.1
Content-type: application/json

{
   "Engine": "string",
   "LanguageCode": "string",
   "LexiconNames": [ "string" ],
   "OutputFormat": "string",
   "SampleRate": "string",
   "SpeechMarkTypes": [ "string" ],
   "Text": "string",
   "TextType": "string",
   "VoiceId": "string"
}

Parameter Permintaan URI

Permintaan tidak menggunakan parameter URI apa pun.

Isi Permintaan

Permintaan menerima data berikut dalam format JSON.

Engine

Menentukan mesin (standard,, neurallong-form, ataugenerative) untuk Amazon Polly untuk digunakan saat memproses teks input untuk sintesis ucapan. Sediakan mesin yang didukung oleh suara yang Anda pilih. Jika Anda tidak menyediakan mesin, mesin standar dipilih secara default. Jika suara yang dipilih tidak didukung oleh mesin standar, ini akan mengakibatkan kesalahan. Untuk informasi tentang suara Amazon Polly dan suara mana yang tersedia untuk setiap mesin, lihat Suara yang Tersedia.

Tipe: String

Nilai yang valid: standard | neural | long-form | generative

Wajib: Ya

Tipe: String

Nilai yang Valid: standard | neural | long-form | generative

Wajib: Tidak

LanguageCode

Kode bahasa opsional untuk permintaan Synthesize Speech. Ini hanya diperlukan jika menggunakan suara bilingual, seperti Aditi, yang dapat digunakan untuk bahasa Inggris India (En-in) atau Hindi (Hi-in).

Jika suara bilingual digunakan dan tidak ada kode bahasa yang ditentukan, Amazon Polly menggunakan bahasa default suara dwibahasa. Bahasa default untuk suara apa pun adalah yang dikembalikan oleh DescribeVoicesoperasi untuk LanguageCode parameter. Misalnya, jika tidak ada kode bahasa yang ditentukan, Aditi akan menggunakan bahasa Inggris India daripada bahasa Hindi.

Tipe: String

Wajib: Tidak

LexiconNames

Daftar satu atau lebih nama leksikon pengucapan yang Anda inginkan untuk diterapkan layanan selama sintesis. Leksikon diterapkan hanya jika bahasa leksikon sama dengan bahasa suara. Untuk informasi tentang menyimpan leksikon, lihat PutLexicon.

Tipe: Array string

Anggota Array: Jumlah maksimum 5 item.

Pola: [0-9A-Za-z]{1,20}

Wajib: Tidak

OutputFormat

Format di mana output yang dikembalikan akan dikodekan. Untuk streaming audio, ini akan menjadi mp3, ogg_vorbis, atau pcm. Untuk tanda bicara, ini akan menjadi json.

Saat pcm digunakan, konten yang dikembalikan adalah audio/pcm dalam format 16-bit, 1 saluran (mono), endian kecil yang ditandatangani.

Tipe: String

Nilai yang Valid: json | mp3 | ogg_vorbis | pcm

Wajib: Ya

SampleRate

Frekuensi audio yang ditentukan dalam Hz.

Nilai yang valid untuk mp3 dan ogg_vorbis adalah “8000", “16000", “22050", dan “24000". Nilai default untuk suara standar adalah “22050". Nilai default untuk suara saraf adalah “24000". Nilai default untuk suara bentuk panjang adalah “24000". Nilai default untuk suara generatif adalah “24000".

Nilai yang valid untuk pcm adalah “8000" dan “16000" Nilai default adalah “16000".

Tipe: String

Wajib: Tidak

SpeechMarkTypes

Jenis tanda bicara yang dikembalikan untuk teks input.

Tipe: Array string

Anggota Array: Jumlah maksimum 4 item.

Nilai yang Valid: sentence | ssml | viseme | word

Wajib: Tidak

Text

Masukan teks untuk mensintesis. Jika Anda menentukan ssml sebagaiTextType, ikuti format SSML untuk teks input.

Tipe: String

Diperlukan: Ya

TextType

Menentukan apakah teks input adalah teks biasa atau SSML. Nilai defaultnya adalah teks biasa. Untuk informasi selengkapnya, lihat Menggunakan SSML.

Tipe: String

Nilai yang Valid: ssml | text

Wajib: Tidak

VoiceId

ID suara untuk digunakan untuk sintesis. Anda bisa mendapatkan daftar suara yang tersedia IDs dengan memanggil DescribeVoicesoperasi.

Tipe: String

Wajib: Ya

Sintaksis Respons


HTTP/1.1 200
Content-Type: ContentType
x-amzn-RequestCharacters: RequestCharacters

AudioStream

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Respons mengembalikan header HTTP berikut.

ContentType

Menentukan jenis aliran audio. Ini harus mencerminkan OutputFormat parameter dalam permintaan Anda.

Jika Anda meminta mp3 sebagaiOutputFormat, yang ContentType dikembalikan adalah audio/mpeg.
Jika Anda meminta ogg_vorbis sebagaiOutputFormat, yang ContentType dikembalikan adalah audio/ogg.
Jika Anda meminta pcm sebagaiOutputFormat, yang ContentType dikembalikan adalah audio/pcm dalam format 16-bit, 1 saluran (mono), endian kecil yang ditandatangani.
Jika Anda meminta json sebagaiOutputFormat, yang ContentType dikembalikan adalah aplikasi/x-json-stream.

RequestCharacters

Jumlah karakter yang disintesis.

Respons mengembalikan yang berikut sebagai isi HTTP.

AudioStream: Aliran yang berisi pidato yang disintesis.

Kesalahan

EngineNotSupportedException

Mesin ini tidak kompatibel dengan suara yang Anda tunjuk. Pilih suara baru yang kompatibel dengan mesin atau ganti mesin dan nyalakan kembali operasi.

Kode Status HTTP: 400

InvalidSampleRateException

Tingkat sampel yang ditentukan tidak valid.

Kode Status HTTP: 400

InvalidSsmlException

SSML yang Anda berikan tidak valid. Verifikasi sintaks SSML, ejaan tag dan nilai, lalu coba lagi.

Kode Status HTTP: 400

LanguageNotSupportedException

Bahasa yang ditentukan saat ini tidak didukung oleh Amazon Polly dalam kapasitas ini.

Kode Status HTTP: 400

LexiconNotFoundException

Amazon Polly tidak dapat menemukan leksikon yang ditentukan. Ini bisa disebabkan oleh leksikon yang hilang, namanya salah eja atau menentukan leksikon yang ada di wilayah berbeda.

Verifikasi bahwa leksikon ada, ada di wilayah (lihatListLexicons) dan Anda mengeja namanya dieja dengan benar. Kemudian coba lagi.

Kode Status HTTP: 404

MarksNotSupportedForFormatException

Tanda ucapan tidak didukung untuk yang OutputFormat dipilih. Tanda ucapan hanya tersedia untuk konten dalam json format.

Kode Status HTTP: 400

ServiceFailureException

Kondisi yang tidak diketahui telah menyebabkan kegagalan layanan.

Kode Status HTTP: 500

SsmlMarksNotSupportedForTextTypeException

Tanda ucapan SSML tidak didukung untuk input tipe teks biasa.

Kode Status HTTP: 400

TextLengthExceededException

Nilai parameter “Teks” lebih panjang dari batas yang diterima. Untuk SynthesizeSpeech API, batas untuk teks input adalah maksimum 6000 karakter total, yang tidak lebih dari 3000 karakter dapat ditagih. Untuk StartSpeechSynthesisTask API, maksimum adalah 200.000 karakter, yang tidak lebih dari 100.000 karakter dapat ditagih. Tag SSML tidak dihitung sebagai karakter yang ditagih.

Kode Status HTTP: 400

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API ini di salah satu bahasa khusus AWS SDKs, lihat berikut ini:

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

StartSpeechSynthesisTask

Tipe Data