Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Kuota di Amazon Polly
Amazon Polly menerapkan kuota untuk lalu lintas pelanggan dengan menolak permintaan yang berlebihan. Kuota default untuk SynthesizeSpeech
permintaan dengan suara standar adalah 80 transaksi per detik (tps), dalam satu wilayah, untuk satu. Akun AWS Jika batas tidak meningkat, dan jika Anda menghasilkan 100 SynthesizeSpeech
permintaan per detik menggunakan suara standar, 80 permintaan per detik akan berhasil, dan 20 permintaan per detik akan dibatasi oleh Amazon Polly. Permintaan ini akan mengembalikan respons dengan status HTTP 400, dan header respons yang menunjukkanThrottlingException
. Amazon Polly juga membatasi lalu lintas ke semua operasi berdasarkan tingkat permintaan.
Contoh batas sintesis ucapan
-
Sintesis 24 huruf pertama dari alfabet Inggris satu huruf pada satu waktu. Jika sintesis setiap huruf membutuhkan waktu kurang dari 50 milidetik, dengan batas operasi delapan tps, mensintesis 24 huruf akan memakan waktu setidaknya tiga detik. Selama waktu itu, Anda dapat mensintesis hingga delapan huruf per detik. Permintaan lebih lanjut akan dibatasi. Karena permintaan berlangsung dalam waktu singkat, mereka akan disintesis secara serial tanpa tumpang tindih.
-
Sintesis 16 paragraf teks. Jika setiap paragraf disintesis dan diterima sepenuhnya di sisi klien dalam dua detik atau kurang, dengan batas operasi delapan permintaan bersamaan, dibutuhkan setidaknya empat detik untuk mensintesis semua 16 artikel. Di detik pertama, Anda dapat memulai hingga delapan permintaan. Selama permintaan bersamaan, setiap upaya untuk memulai sintesis baru akan dibatasi karena batas konkurensi. Anda dapat mensintesis delapan paragraf yang tersisa setelah dua detik pertama, setelah batch permintaan pertama selesai.
Ingatlah batasan berikut saat menggunakan Amazon Polly.
Topik
Wilayah yang didukung
Untuk daftar AWS Wilayah di mana Amazon Polly tersedia, lihat Titik Akhir dan Kuota Amazon Polly di. Referensi Umum Amazon Web Services
-
Untuk Wilayah yang mendukung suara generatif, lihat Suara generatif.
-
Untuk Wilayah yang mendukung suara bentuk panjang, lihat Suara bentuk panjang.
-
Untuk Wilayah yang mendukung suara saraf, lihat Kompatibilitas fitur dan wilayah TTS saraf.
Kuota dan laju throttle
Tabel berikut mendefinisikan laju throttle per operasi Amazon Polly. Anda dapat menggunakan AWS Management Console untuk meminta kenaikan kuota untuk kuota yang dapat disesuaikan bila diperlukan.
Operasi |
Kuota |
---|---|
Leksikon |
|
|
Setiap 2 transaksi per detik (tps) dari operasi ini digabungkan. Letupan maksimum yang diizinkan sebesar 4 tps. |
Pidato |
|
|
80 tps dengan batas burst 100 tps |
|
Suara generatif: 8 tps Suara bentuk panjang: 8 tps dengan batas burst 10 tps Suara saraf: 8 tps dengan batas burst 10 tps Suara standar: 80 tps dengan batas burst 100 tps |
|
Suara generatif: 1 tps Suara bentuk panjang: 1 tps Suara saraf: 1 tps Suara standar: 10 tps dengan batas burst 12 tps |
|
Maksimum yang diizinkan 10 tps digabungkan |
Permintaan bersamaan
Untuk suara generatif, Amazon Polly mendukung hingga 26 permintaan bersamaan. Untuk suara bentuk panjang, Amazon Polly mendukung hingga 26 permintaan bersamaan. Untuk suara saraf, Amazon Polly mendukung 8 tps dengan batas burst 10 tps, hingga 18 permintaan bersamaan. Amazon Polly juga mendukung batasan untuk permintaan bersamaan. Untuk suara standar, Amazon Polly mendukung 80 tps hingga 80 permintaan bersamaan.
Praktik terbaik untuk mengurangi pelambatan
-
Coba lagi throttle dengan backoff dan jitter sehingga Anda dapat menyebarkan beban dalam waktu singkat, dan menangani puncak penggunaan yang tidak terduga tanpa mengorbankan ketersediaan. Katalog Kode Sampel AWS sudah dikonfigurasi untuk melakukan ini secara default dalam banyak bahasa pemrograman. Kunjungi perilaku coba lagi fitur untuk melihat detailnya.
-
Gunakan metrik Amazon Polly. Amazon Polly secara otomatis menerbitkan CloudWatch untuk menganalisis penggunaan Anda saat ini dan memperkirakan pertumbuhan penggunaan.
catatan
Sebelum meminta kenaikan kuota (jika berlaku), hitung kebutuhan tps Anda mengikuti pedoman di halaman ini. Amazon Polly hanya mengamankan sumber daya komputasi yang diperlukan sesuai dengan permintaan pelanggan untuk menjaga biaya Anda tetap rendah.
Leksikon pengucapan
-
Anda dapat menyimpan hingga 100 leksikon per akun.
-
Nama leksikon dapat berupa string alfanumerik hingga 20 karakter.
-
Setiap leksikon dapat berukuran hingga 40.000 karakter. (Perhatikan bahwa ukuran leksikon mempengaruhi latensi SynthesizeSpeech operasi.)
-
Anda dapat menentukan hingga 100 karakter untuk masing-masing <phoneme>atau <alias>penggantian dalam leksikon.
Untuk informasi tentang penggunaan leksikon, lihatMengelola leksikon.
SynthesizeSpeech Operasi API
Saat memperkirakan penggunaanSynthesizeSpeech
, perlu diingat bahwa audio yang dihasilkan oleh Amazon Polly, terutama untuk aplikasi interaktif, biasanya membutuhkan waktu setidaknya beberapa detik untuk diputar. Hal ini mengurangi tingkat permintaan untukSynthesizeSpeech
, bahkan untuk sejumlah besar konsumen bersamaan. Selain itu, Amazon Polly membatasi permintaan berdasarkan jumlah SynthesizeSpeech
permintaan bersamaan yang disintesis. Tidak ada pengaturan terpisah untuk permintaan bersamaan. Batas permintaan bersamaan selalu memiliki nilai yang sama dengan jumlah tps yang diizinkan dan diskalakan dengannya.
Contoh aplikasi cerita pendek. Anda dapat menggunakan Amazon Polly untuk membangun aplikasi yang memainkan serangkaian cerita pendek. Dengan aplikasi semacam ini, cerita pertama akan mulai diputar, dan kemudian berikutnya, dan seterusnya, sampai pengguna keluar dari aplikasi. Setiap cerita akan memakan waktu sekitar 0,5 detik untuk disintesis dan 10 detik untuk diputar. Dalam skenario ini, Anda dapat mengharapkan satu panggilan SynthesizeSpeech
untuk setiap 10 detik yang dihabiskan pelanggan menggunakan aplikasi. Ini akan diterjemahkan menjadi satu panggilan per detik untuk setiap 10 pelanggan yang secara bersamaan menggunakan aplikasi. Jika Anda memiliki 1000 pelanggan secara bersamaan menggunakan aplikasi, Anda dapat mengharapkan tingkat panggilan rata-rata hanya 100 transaksi per detik. SynthesizeSpeech
Perhatikan batasan berikut yang terkait dengan penggunaan operasi SynthesizeSpeech
API:
-
Ukuran teks input dapat mencapai 3000 karakter yang ditagih (total 6000 karakter). Tag SSML tidak dihitung sebagai karakter yang ditagih.
-
Anda dapat menentukan hingga lima leksikon untuk diterapkan ke teks input.
-
Aliran audio output (sintesis) dibatasi hingga 10 menit. Setelah ini tercapai, pidato yang tersisa terputus.
Untuk informasi selengkapnya, lihat SynthesizeSpeech.
catatan
Beberapa batasan operasi SynthesizeSpeech
API dapat dilewati menggunakan operasi StartSythensizeSpeechTask
API. Untuk informasi selengkapnya, lihat File audio panjang.
SpeechSynthesisTask Operasi API
Perhatikan batasan berikut yang berkaitan dengan penggunaanStartSpeechSynthesisTask
,GetSpeechSynthesisTask
, dan operasi ListSpeechSynthesisTasks
API:
-
Ukuran teks input dapat mencapai 100.000 karakter yang ditagih (total 200.000 karakter). Tag SSML tidak dihitung sebagai karakter yang ditagih.
-
Anda dapat menentukan hingga lima leksikon untuk diterapkan ke teks input.
Bahasa Markup Sintesis Pidato (SSML)
Perhatikan batasan berikut yang terkait dengan penggunaan SSML:
-
Tag
<audio>
<lexicon>
,<lookup>
, dan<voice>
tag tidak didukung. -
<break>
elemen dapat menentukan durasi maksimum masing-masing 10 detik. -
<prosody>
Tag tidak mendukung nilai untuk atribut rate yang lebih rendah dari -80%.
Untuk informasi selengkapnya, lihat Menghasilkan pidato dari SSML dokumen.