Output tanda ucapan

Amazon Polly mengembalikan objek tanda ucapan dalam aliran JSON yang dibatasi garis. Objek tanda ucapan berisi bidang-bidang berikut:

waktu — stempel waktu dalam milidetik dari awal aliran audio yang sesuai
jenis — jenis tanda bicara (kalimat, kata, viseme, atau ssml)
start — offset dalam byte (bukan karakter) dari awal objek dalam teks input (tidak termasuk tanda viseme)
akhir — offset dalam byte (bukan karakter) dari ujung objek dalam teks input (tidak termasuk tanda viseme)
nilai — ini bervariasi tergantung pada jenis tanda bicara
- SSML: Tag SSML <mark>
- viseme: nama viseme
- kata atau kalimat: substring dari teks input, seperti yang dibatasi oleh bidang awal dan akhir

Misalnya, Amazon Polly menghasilkan objek tanda word ucapan berikut dari teks “Mary had a little lamb”:


{"time":373,"type":"word","start":5,"end":8,"value":"had"}

Kata yang dijelaskan (“had”) dimulai 373 milidetik setelah aliran audio dimulai, dan dimulai pada byte 5 dan berakhir pada byte 8 dari teks input.

Metadata ini untuk voice-id. Joanna Jika Anda menggunakan suara lain dengan teks input yang sama, metadata mungkin berbeda.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Visemes dan Amazon Polly

Meminta tanda pidato