Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mengunggah leksikon
Leksikon yang Anda gunakan harus sesuai dengan rekomendasi Spesifikasi Leksikon Pengucapan (PLS) W3C. Untuk informasi selengkapnya, lihat Spesifikasi Leksikon Pengucapan (PLS) Versi 1.0
- Console - Lexicons tab
-
Untuk menggunakan leksikon pengucapan, Anda harus mengunggahnya terlebih dahulu. Ada dua lokasi di konsol tempat Anda dapat mengunggah leksikon, tab Text-to-Speech dan tab Lexicons.
Proses berikut menjelaskan cara menambahkan leksikon yang dapat Anda gunakan untuk menyesuaikan bagaimana kata dan frasa yang tidak umum untuk bahasa yang dipilih diucapkan.
Untuk menambahkan leksikon dari tab Lexicons
Masuk ke AWS Management Console dan buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/
-
Pilih tab Lexicons.
-
Pilih Unggah leksikon.
-
Berikan nama untuk leksikon dan kemudian gunakan Pilih file leksikon untuk menemukan leksikon yang akan diunggah. Anda hanya dapat mengunggah PLS file dengan ekstensi.pls atau.xl.
-
Pilih Unggah leksikon. Jika leksikon dengan nama yang sama (apakah file.pls atau.xl) sudah ada, mengunggah leksikon menimpa leksikon yang ada.
- Console - TTS tab
-
Untuk menambahkan leksikon dari tab text-to-Speech
Masuk ke AWS Management Console dan buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/
-
Pilih tab Text-to-Speech.
-
Perluas Pengaturan tambahan, aktifkan Sesuaikan pengucapan, lalu pilih Unggah leksikon.
-
Berikan nama untuk leksikon dan kemudian gunakan Pilih file leksikon untuk menemukan leksikon yang akan diunggah. Anda hanya dapat menggunakan PLS file dengan ekstensi.pls atau.xl.
-
Pilih Unggah leksikon. Jika leksikon dengan nama yang sama (apakah file.pls atau.xl) sudah ada, mengunggah leksikon akan menimpa leksikon yang ada.
- AWS CLI - one lexeme
-
Dengan Amazon Polly, Anda dapat menggunakan PutLexicon untuk menyimpan leksikon pengucapan di AWS Wilayah tertentu untuk akun Anda. Kemudian, Anda dapat menentukan satu atau lebih leksikon yang disimpan ini dalam SynthesizeSpeech permintaan Anda yang ingin Anda terapkan sebelum layanan mulai mensintesis teks. Untuk informasi selengkapnya, lihat Mengelola leksikon.
Pertimbangkan leksikon yang sesuai dengan W3C PLS berikut.
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> </lexicon>
Perhatikan hal berikut:
-
Dua atribut yang ditentukan dalam
<lexicon>
elemen:-
xml:lang
Atribut menentukan kode bahasa,en-US
, yang leksikon berlaku. Amazon Polly dapat menggunakan leksikon contoh ini jika suara yang Anda tentukan dalamSynthesizeSpeech
panggilan memiliki kode bahasa yang sama (en-US).catatan
Anda dapat menggunakan
DescribeVoices
operasi untuk menemukan kode bahasa yang terkait dengan suara. -
alphabet
Atribut menentukanIPA
, yang berarti bahwa alfabet fonetik internasional (IPA) digunakan untuk pengucapan. IPAadalah salah satu huruf untuk menulis pengucapan. Amazon Polly juga mendukung Extended Speech Assessment Methods Phonetic Alphabet (X-). SAMPA
-
-
<lexeme>
Elemen menggambarkan pemetaan antara<grapheme>
(yaitu, representasi tekstual dari kata) dan.<alias>
Untuk menguji leksikon ini, lakukan hal berikut:
-
Simpan leksikon sebagai
example.pls
. -
Jalankan
put-lexicon
AWS CLI perintah untuk menyimpan leksikon (dengan namaw3c
), di wilayah us-east-2.aws polly put-lexicon \ --name w3c \ --content file://example.pls
-
Jalankan
synthesize-speech
perintah untuk mensintesis teks sampel ke aliran audio (speech.mp3
), dan tentukanlexicon-name
parameter opsional.aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
-
Mainkan hasilnya
speech.mp3
, dan perhatikan bahwa kata W3C dalam teks digantikan oleh World Wide Web Consortium.
Contoh leksikon sebelumnya menggunakan alias. IPAAlfabet yang disebutkan dalam leksikon tidak digunakan. Leksikon berikut menentukan pengucapan fonetik menggunakan
<phoneme>
elemen dengan alfabet. IPA<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>pecan</grapheme> <phoneme>pɪˈkɑːn</phoneme> </lexeme> </lexicon>
Ikuti langkah yang sama untuk menguji leksikon ini. Pastikan Anda menentukan teks input yang memiliki kata “pecan” (misalnya, “Pecan pie is delicious”).
Lihat sumber daya berikut untuk contoh kode tambahan untuk PutLexicon API operasi:
-
Contoh Java: PutLexicon
-
Python (Boto3) Contoh: PutLexicon
-
- AWS CLI - multiple lexemes
-
Dengan Amazon Polly, Anda dapat menggunakan PutLexicon untuk menyimpan leksikon pengucapan di AWS Wilayah tertentu untuk akun Anda. Kemudian, Anda dapat menentukan satu atau lebih leksikon yang disimpan ini dalam SynthesizeSpeech permintaan Anda yang ingin Anda terapkan sebelum layanan mulai mensintesis teks. Untuk informasi selengkapnya, lihat Mengelola leksikon.
Dalam contoh ini, leksem yang Anda tentukan dalam leksikon berlaku secara eksklusif untuk teks input untuk sintesis. Pertimbangkan leksikon berikut:
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme> <lexeme> <grapheme>Consortium</grapheme> <alias>Community</alias> </lexeme> </lexicon>
Leksikon menentukan tiga leksem, dua di antaranya mendefinisikan alias untuk grafem W3C sebagai berikut:
-
Elemen
<lexeme
> pertama mendefinisikan alias (World Wide Web Consortium). -
Yang kedua
<lexeme>
mendefinisikan alias alternatif (WWWKonsorsium).
Amazon Polly menggunakan pengganti pertama untuk setiap grafem tertentu dalam leksikon.
Yang ketiga
<lexeme>
mendefinisikan pengganti (Komunitas) untuk kata Konsorsium.Pertama, mari kita uji leksikon ini. Misalkan Anda ingin mensintesis teks sampel berikut ke file audio (
speech.mp3
), dan Anda menentukan leksikon dalam panggilan ke.SynthesizeSpeech
The W3C is a Consortium
SynthesizeSpeech
pertama menerapkan leksikon sebagai berikut:-
Sesuai leksem pertama, kata W3C direvisi menjadi World Wide Web Consortium. Teks yang direvisi muncul sebagai berikut:
The World Wide Web Consortium is a Consortium
-
Alias yang didefinisikan dalam leksem ketiga hanya berlaku untuk kata Konsorsium yang merupakan bagian dari teks asli, menghasilkan teks berikut:
The World Wide Web Consortium is a Community.
Anda dapat menguji ini menggunakan AWS CLI sebagai berikut:
Simpan leksikon sebagai
example.pls
.Jalankan
put-lexicon
perintah untuk menyimpan leksikon dengan nama w3c di wilayah us-east-2.aws polly put-lexicon \ --name w3c \ --content file://example.pls
Jalankan
list-lexicons
perintah untuk memverifikasi bahwa leksikon w3c ada dalam daftar leksikon yang dikembalikan.aws polly list-lexicons
-
Jalankan
synthesize-speech
perintah untuk mensintesis teks sampel ke file audio (speech.mp3
), dan tentukanlexicon-name
parameter opsional.aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
Putar
speech.mp3
file yang dihasilkan untuk memverifikasi bahwa ucapan yang disintesis mencerminkan perubahan teks.
Lihat sumber daya berikut untuk contoh kode tambahan untuk PutLexicon API operasi:
-
Contoh Java: PutLexicon
-
Python (Boto3) Contoh: PutLexicon
-