Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Amazon Polly mengembalikan objek tanda ucapan dalam aliran JSON yang dibatasi garis. Objek tanda ucapan berisi bidang-bidang berikut:
-
waktu — stempel waktu dalam milidetik dari awal aliran audio yang sesuai
-
jenis — jenis tanda bicara (kalimat, kata, viseme, atau ssml)
-
start — offset dalam byte (bukan karakter) dari awal objek dalam teks input (tidak termasuk tanda viseme)
-
akhir — offset dalam byte (bukan karakter) dari ujung objek dalam teks input (tidak termasuk tanda viseme)
-
nilai — ini bervariasi tergantung pada jenis tanda bicara
SSML: Tag SSML <mark>
viseme: nama viseme
kata atau kalimat: substring dari teks masukan, seperti yang dibatasi oleh bidang awal dan akhir
Misalnya, Amazon Polly menghasilkan objek tanda word
ucapan berikut dari teks “Mary had a little lamb”:
{"time":373,"type":"word","start":5,"end":8,"value":"had"}
Kata yang dijelaskan (“had”) dimulai 373 milidetik setelah aliran audio dimulai, dan dimulai pada byte 5 dan berakhir pada byte 8 dari teks input.
catatan
Metadata ini untuk voice-id. Joanna
Jika Anda menggunakan suara lain dengan teks input yang sama, metadata mungkin berbeda.