Wilayah yang didukung Kuota dan laju throttle Leksikon pengucapan SynthesizeSpeech Operasi API SpeechSynthesisTask Operasi API Bahasa Markup Sintesis Pidato (SSML)

Kuota di Amazon Polly

Amazon Polly menerapkan kuota untuk lalu lintas pelanggan dengan menolak permintaan yang berlebihan. Kuota default untuk SynthesizeSpeech permintaan dengan suara standar adalah 80 transaksi per detik (tps), dalam satu wilayah, untuk satu. Akun AWS Jika batas tidak meningkat, dan jika Anda menghasilkan 100 SynthesizeSpeech permintaan per detik menggunakan suara standar, 80 permintaan per detik akan berhasil, dan 20 permintaan per detik akan dibatasi oleh Amazon Polly. Permintaan ini akan mengembalikan respons dengan status HTTP 400, dan header respons yang menunjukkanThrottlingException. Amazon Polly juga membatasi lalu lintas ke semua operasi berdasarkan tingkat permintaan.

Contoh batas sintesis ucapan

Sintesis 24 huruf pertama dari alfabet Inggris satu huruf pada satu waktu. Jika sintesis setiap huruf membutuhkan waktu kurang dari 50 milidetik, dengan batas operasi delapan tps, mensintesis 24 huruf akan memakan waktu setidaknya tiga detik. Selama waktu itu, Anda dapat mensintesis hingga delapan huruf per detik. Permintaan lebih lanjut akan dibatasi. Karena permintaan berlangsung dalam waktu singkat, mereka akan disintesis secara serial tanpa tumpang tindih.
Sintesis 16 paragraf teks. Jika setiap paragraf disintesis dan diterima sepenuhnya di sisi klien dalam dua detik atau kurang, dengan batas operasi delapan permintaan bersamaan, dibutuhkan setidaknya empat detik untuk mensintesis semua 16 artikel. Di detik pertama, Anda dapat memulai hingga delapan permintaan. Selama permintaan bersamaan, setiap upaya untuk memulai sintesis baru akan dibatasi karena batas konkurensi. Anda dapat mensintesis delapan paragraf yang tersisa setelah dua detik pertama, setelah batch permintaan pertama selesai.

Ingatlah batasan berikut saat menggunakan Amazon Polly.

Wilayah yang didukung

Untuk daftar AWS Wilayah tempat Amazon Polly tersedia, lihat Titik Akhir dan Kuota Amazon Polly di. Referensi Umum Amazon Web Services

Untuk Wilayah yang mendukung suara generatif, lihat Suara generatif.
Untuk Wilayah yang mendukung suara bentuk panjang, lihat Long-form suara.
Untuk Wilayah yang mendukung suara saraf, lihat Kompatibilitas fitur dan wilayah TTS saraf.

Kuota dan laju throttle

Tabel berikut mendefinisikan laju throttle per operasi Amazon Polly. Anda dapat menggunakan Konsol Manajemen AWS untuk meminta kenaikan kuota untuk kuota yang dapat disesuaikan bila diperlukan.

Operasi	Kuota
Leksikon
`DeleteLexicon` `PutLexicon` `GetLexicon` `ListLexicons`	Setiap 2 transaksi per detik (tps) dari operasi ini digabungkan. Letupan maksimum yang diizinkan sebesar 4 tps.
Pidato
`DescribeVoices`	80 tps dengan batas burst 100 tps
`SynthesizeSpeech`	Suara generatif: 8 tps Long-form suara: 8 tps dengan batas burst 10 tps Suara saraf: 8 tps dengan batas burst 10 tps Suara standar: 80 tps dengan batas burst 100 tps
`StartSpeechSynthesisTask`	Suara generatif: 1 tps Long-form suara: 1 tps Suara saraf: 10 tps Suara standar: 10 tps dengan batas burst 12 tps
`StartSpeechSynthesisStream`	Suara generatif: 8 tps
`GetSynthesizeSpeechTask` dan `ListSynthesizeSpeechTask`	Maksimum yang diizinkan 10 tps digabungkan

Permintaan bersamaan

Untuk suara generatif, Amazon Polly mendukung hingga 26 permintaan bersamaan. Untuk suara bentuk panjang, Amazon Polly mendukung hingga 26 permintaan bersamaan. Untuk suara saraf, Amazon Polly mendukung 8 tps dengan batas burst 10 tps, hingga 18 permintaan bersamaan. Amazon Polly juga mendukung batasan untuk permintaan bersamaan. Untuk suara standar, Amazon Polly mendukung 80 tps hingga 80 permintaan bersamaan.

Untuk StartSpeechSynthesisStream, Amazon Polly mendukung hingga 8 permintaan bersamaan.

Praktik terbaik untuk mengurangi pelambatan

Coba lagi throttle dengan backoff dan jitter sehingga Anda dapat menyebarkan beban dalam waktu singkat, dan menangani puncak penggunaan yang tidak terduga tanpa mengorbankan ketersediaan. Katalog Kode Sampel AWS sudah dikonfigurasi untuk melakukan ini secara default dalam banyak bahasa pemrograman. Kunjungi perilaku coba lagi fitur untuk melihat detailnya.
Gunakan metrik Amazon Polly. Amazon Polly secara otomatis menerbitkan CloudWatch untuk menganalisis penggunaan Anda saat ini dan memperkirakan pertumbuhan penggunaan.

catatan

Sebelum meminta kenaikan kuota (jika berlaku), hitung kebutuhan tps Anda mengikuti pedoman di halaman ini. Amazon Polly hanya mengamankan sumber daya komputasi yang diperlukan sesuai dengan permintaan pelanggan untuk menjaga biaya Anda tetap rendah.

Leksikon pengucapan

Anda dapat menyimpan hingga 100 leksikon per akun.
Nama leksikon dapat berupa string alfanumerik hingga 20 karakter.
Setiap leksikon dapat berukuran hingga 40.000 karakter. (Perhatikan bahwa ukuran leksikon mempengaruhi latensi SynthesizeSpeech operasi.)
Anda dapat menentukan hingga 100 karakter untuk masing-masing <phoneme>atau <alias>penggantian dalam leksikon.

Untuk informasi tentang penggunaan leksikon, lihatMengelola leksikon.

SynthesizeSpeech Operasi API

Saat memperkirakan penggunaanSynthesizeSpeech, perlu diingat bahwa audio yang diproduksi oleh Amazon Polly, terutama untuk aplikasi interaktif, biasanya membutuhkan waktu setidaknya beberapa detik untuk diputar. Ini mengurangi tingkat permintaanSynthesizeSpeech, bahkan untuk sejumlah besar konsumen bersamaan. Selain itu, Amazon Polly membatasi permintaan berdasarkan jumlah SynthesizeSpeech permintaan bersamaan yang disintesis. Tidak ada pengaturan terpisah untuk permintaan bersamaan. Batas permintaan bersamaan selalu memiliki nilai yang sama dengan jumlah tps yang diizinkan dan diskalakan dengannya.

Contoh aplikasi cerita pendek. Anda dapat menggunakan Amazon Polly untuk membangun aplikasi yang memainkan serangkaian cerita pendek. Dengan aplikasi semacam ini, cerita pertama akan mulai diputar, dan kemudian berikutnya, dan seterusnya, sampai pengguna keluar dari aplikasi. Setiap cerita akan memakan waktu sekitar 0,5 detik untuk disintesis dan 10 detik untuk diputar. Dalam skenario ini, Anda dapat mengharapkan satu panggilan SynthesizeSpeech untuk setiap 10 detik yang dihabiskan pelanggan menggunakan aplikasi. Ini akan diterjemahkan menjadi satu panggilan per detik untuk setiap 10 pelanggan yang secara bersamaan menggunakan aplikasi. Jika Anda memiliki 1000 pelanggan secara bersamaan menggunakan aplikasi, Anda dapat mengharapkan tingkat panggilan rata-rata hanya 100 transaksi per detik. SynthesizeSpeech

Perhatikan batasan berikut yang terkait dengan penggunaan operasi SynthesizeSpeech API:

Ukuran teks input dapat mencapai 3000 karakter yang ditagih (total 6000 karakter). Tag SSML tidak dihitung sebagai karakter yang ditagih.
Anda dapat menentukan hingga lima leksikon untuk diterapkan ke teks input.
Aliran audio output (sintesis) dibatasi hingga 10 menit. Setelah ini tercapai, pidato yang tersisa terputus.

Untuk informasi selengkapnya, lihat SynthesizeSpeech.

catatan

Beberapa batasan operasi SynthesizeSpeech API dapat dilewati menggunakan operasi StartSythensizeSpeechTask API. Untuk informasi selengkapnya, lihat File audio panjang.

SpeechSynthesisTask Operasi API

Perhatikan batasan berikut terkait penggunaanStartSpeechSynthesisTask,GetSpeechSynthesisTask, dan operasi ListSpeechSynthesisTasks API:

Ukuran teks input dapat mencapai 100.000 karakter yang ditagih (total 200.000 karakter). Tag SSML tidak dihitung sebagai karakter yang ditagih.
Anda dapat menentukan hingga lima leksikon untuk diterapkan ke teks input.

Bahasa Markup Sintesis Pidato (SSML)

Perhatikan batasan berikut yang terkait dengan penggunaan SSML:

Tag <audio><lexicon>,<lookup>, dan <voice> tag tidak didukung.
<break>elemen dapat menentukan durasi maksimum masing-masing 10 detik.
<prosody>Tag tidak mendukung nilai untuk atribut rate yang lebih rendah dari -80%.

Lihat informasi yang lebih lengkap di Menghasilkan pidato dari dokumen SSML.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Membuat file audio yang panjang

Contoh kode dan aplikasi