Pilih preferensi cookie Anda

Kami menggunakan cookie penting serta alat serupa yang diperlukan untuk menyediakan situs dan layanan. Kami menggunakan cookie performa untuk mengumpulkan statistik anonim sehingga kami dapat memahami cara pelanggan menggunakan situs dan melakukan perbaikan. Cookie penting tidak dapat dinonaktifkan, tetapi Anda dapat mengklik “Kustom” atau “Tolak” untuk menolak cookie performa.

Jika Anda setuju, AWS dan pihak ketiga yang disetujui juga akan menggunakan cookie untuk menyediakan fitur situs yang berguna, mengingat preferensi Anda, dan menampilkan konten yang relevan, termasuk iklan yang relevan. Untuk menerima atau menolak semua cookie yang tidak penting, klik “Terima” atau “Tolak”. Untuk membuat pilihan yang lebih detail, klik “Kustomisasi”.

Output tanda ucapan

Mode fokus
Output tanda ucapan - Amazon Polly

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Amazon Polly mengembalikan objek tanda ucapan dalam aliran JSON yang dibatasi garis. Objek tanda ucapan berisi bidang-bidang berikut:

  • waktu — stempel waktu dalam milidetik dari awal aliran audio yang sesuai

  • jenis — jenis tanda bicara (kalimat, kata, viseme, atau ssml)

  • start — offset dalam byte (bukan karakter) dari awal objek dalam teks input (tidak termasuk tanda viseme)

  • akhir — offset dalam byte (bukan karakter) dari ujung objek dalam teks input (tidak termasuk tanda viseme)

  • nilai — ini bervariasi tergantung pada jenis tanda bicara

    • SSML: Tag SSML <mark>

    • viseme: nama viseme

    • kata atau kalimat: substring dari teks masukan, seperti yang dibatasi oleh bidang awal dan akhir

Misalnya, Amazon Polly menghasilkan objek tanda word ucapan berikut dari teks “Mary had a little lamb”:

{"time":373,"type":"word","start":5,"end":8,"value":"had"}

Kata yang dijelaskan (“had”) dimulai 373 milidetik setelah aliran audio dimulai, dan dimulai pada byte 5 dan berakhir pada byte 8 dari teks input.

catatan

Metadata ini untuk voice-id. Joanna Jika Anda menggunakan suara lain dengan teks input yang sama, metadata mungkin berbeda.

PrivasiSyarat situsPreferensi cookie
© 2025, Amazon Web Services, Inc. atau afiliasinya. Semua hak dilindungi undang-undang.