Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Suara generatif
Mesin generatif text-to-speech (TTS) Amazon Polly menawarkan suara percakapan yang paling mirip manusia, terlibat secara emosional, dan adaptif yang tersedia untuk digunakan melalui konsol Amazon Polly.
Mesin Generatif adalah model Amazon TTS Polly terbesar hingga saat ini. Ini menyebarkan transformator miliaran parameter yang mengubah teks mentah menjadi kode ucapan, diikuti oleh dekoder berbasis konvolusi yang mengubah kode ucapan ini menjadi bentuk gelombang secara bertahap dan ramping. Metode ini menunjukkan kemampuan muncul yang dilaporkan secara luas dari Model Bahasa Besar (LLMs) ketika dilatih tentang peningkatan volume data yang tersedia untuk umum dan kepemilikan yang terdiri dari berbagai suara, bahasa, dan gaya.
Mesin Generatif menciptakan ucapan sintetis yang terlibat secara emosional, tegas, dan sangat sehari-hari dengan cara yang sangat mirip dengan suara manusia. Anda dapat menggunakan suara-suara ini sebagai asisten pelanggan yang berpengetahuan luas, pelatih virtual, atau pengiklan dengan pidato sintetis yang hampir manusiawi.
catatan
state-of-the-art Teknologi yang mendasari suara-suara ini termasuk dalam paradigma AI generatif untuk pemodelan bahasa dan suara. Efek samping dari teknologi ini adalah bahwa setiap pembaruan pada data pelatihan dan model dapat menghasilkan sedikit variasi pada cara suara terdengar, bahkan jika kualitas keseluruhannya meningkat dengan pembaruan model. Ini dapat berdampak pada kasus penggunaan dengan bagian konten berbeda yang disintesis dalam jangka waktu yang lama — misalnya, musim podcast.
Suara generatif yang tersedia
Amazon Polly saat ini menawarkan dua suara Inggris wanita dan satu pria dalam varian generatif. Suara generatif ini juga tersedia dalam varian percakapanNTTS.
Bahasa | Kode bahasa | Nama/ID | Gender | |
---|---|---|---|---|
1 |
Inggris (UK) |
id - GB |
Amy |
Perempuan |
2 |
Inggris (US) |
en-US |
Matius Ruth |
Laki-laki Perempuan |
catatan
Biaya suara generatif ditentukan pada halaman informasi harga Amazon Polly
Kompatibilitas fitur dan wilayah
Suara generatif Amazon Polly tersedia di wilayah berikut:
-
AS Timur (Virginia N.): us-east-1
-
Eropa (Frankfurt am Main): eu-central-1
-
Wilayah lain tidak tersedia
Fitur berikut ini didukung untuk suara generatif:
-
Operasi sintesis ucapan waktu nyata dan asinkron.
-
Gaya berbicara penyiar berita tidak didukung di mesin Generatif.
-
Banyak (tetapi tidak semua) SSML tag didukung oleh Amazon Polly. Untuk informasi selengkapnya tentang SSML tag NTTS yang didukung, lihat Tag yang didukung SSML
-
Seperti halnya suara standar, Anda dapat memilih dari berbagai laju pengambilan sampel untuk mengoptimalkan bandwidth dan kualitas audio untuk aplikasi Anda. Tingkat pengambilan sampel yang valid untuk suara standar dan saraf adalah 8kHz, 16, 22 kHzkHz, atau 24. kHz Default untuk suara standar adalah 22kHz. Default untuk suara generatif adalah 24. kHz Amazon Polly mendukungMP3, OGG (Vorbis), dan format streaming PCM audio mentah.
Support untuk menghasilkan tanda ucapan saat ini tidak tersedia.
catatan
Dalam hal halusinasi model yang tidak mungkin terjadi, (dan dengan perilaku model mesin Generatif untuk merender token ucapan dengan token) mekanisme penghentian darurat yang diberlakukan sudah ada. Mekanisme bawaan menghentikan model dari rendering ucapan lebih jauh. Fitur keamanan ini didasarkan pada analisis data di mana model memiliki potensi untuk berhalusinasi, biasanya di akhir kalimat.
Mungkin ada kasus di mana model berpikir itu akan berhalusinasi dan kemudian mungkin berakhir memotong kata selama langkah generasi, sehingga merender setengah kata. Ini berpotensi menghasilkan hasil yang tidak pantas.
Menggunakan mesin Generatif di konsol
Anda dapat mengakses suara generatif Amazon Polly melalui konsol Amazon Polly atau AWS CLI. Dari konsol, pilih mesin Generatif, lalu pilih suara generatif yang sesuai dari daftar untuk mendengar ucapan yang disintesis dalam suara itu. Anda juga dapat menjelajahi suara generatif dengan SynthesizeSpeech
dan StartSpeechSynthesisTask
API operasi. Untuk API operasi, Anda dapat menentukan mesin dan nama suara dalam API permintaan. Untuk mulai cepat memulai contoh kode menggunakan Python, lihat contoh Python.
Untuk menggunakan mesin generatif di konsol
-
Buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/
-
Dari konsol Amazon Polly, pilih mesin Generatif.
-
Pilih suara yang diinginkan dari menu dropdown suara.
-
Hasilkan TTS audio dengan teks pilihan Anda.
catatan
Suara generatif juga dapat digunakan dengan SynthesizeSpeech
dan StartSpeechSynthesisTask
APIoperasi. Untuk API operasi, pelanggan dapat menentukan mesin dan nama suara dalam API permintaan. Anda dapat menemukan lebih banyak contoh kode mulai cepat di sini.