Mengunggah leksikon - Amazon Polly

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Mengunggah leksikon

Leksikon yang Anda gunakan harus sesuai dengan rekomendasi Spesifikasi Leksikon Pengucapan (PLS) W3C. Untuk informasi selengkapnya, lihat Spesifikasi Leksikon Pengucapan (PLS) Versi 1.0 di situs web W3C.

Console - Lexicons tab

Untuk menggunakan leksikon pengucapan, Anda harus mengunggahnya terlebih dahulu. Ada dua lokasi di konsol tempat Anda dapat mengunggah leksikon, tab Text-to-Speech dan tab Lexicons.

Proses berikut menjelaskan cara menambahkan leksikon yang dapat Anda gunakan untuk menyesuaikan bagaimana kata dan frasa yang tidak umum untuk bahasa yang dipilih diucapkan.

Untuk menambahkan leksikon dari tab Lexicons
  1. Masuk ke AWS Management Console dan buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/

  2. Pilih tab Lexicons.

  3. Pilih Unggah leksikon.

  4. Berikan nama untuk leksikon dan kemudian gunakan Pilih file leksikon untuk menemukan leksikon yang akan diunggah. Anda hanya dapat mengunggah PLS file dengan ekstensi.pls atau.xl.

  5. Pilih Unggah leksikon. Jika leksikon dengan nama yang sama (apakah file.pls atau.xl) sudah ada, mengunggah leksikon menimpa leksikon yang ada.

Console - TTS tab
Untuk menambahkan leksikon dari tab text-to-Speech
  1. Masuk ke AWS Management Console dan buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/

  2. Pilih tab Text-to-Speech.

  3. Perluas Pengaturan tambahan, aktifkan Sesuaikan pengucapan, lalu pilih Unggah leksikon.

  4. Berikan nama untuk leksikon dan kemudian gunakan Pilih file leksikon untuk menemukan leksikon yang akan diunggah. Anda hanya dapat menggunakan PLS file dengan ekstensi.pls atau.xl.

  5. Pilih Unggah leksikon. Jika leksikon dengan nama yang sama (apakah file.pls atau.xl) sudah ada, mengunggah leksikon akan menimpa leksikon yang ada.

AWS CLI - one lexeme

Dengan Amazon Polly, Anda dapat menggunakan PutLexicon untuk menyimpan leksikon pengucapan di AWS Wilayah tertentu untuk akun Anda. Kemudian, Anda dapat menentukan satu atau lebih leksikon yang disimpan ini dalam SynthesizeSpeech permintaan Anda yang ingin Anda terapkan sebelum layanan mulai mensintesis teks. Untuk informasi selengkapnya, lihat Mengelola leksikon.

Pertimbangkan leksikon yang sesuai dengan W3C PLS berikut.

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> </lexicon>

Perhatikan hal berikut:

  • Dua atribut yang ditentukan dalam <lexicon> elemen:

    • xml:langAtribut menentukan kode bahasa,en-US, yang leksikon berlaku. Amazon Polly dapat menggunakan leksikon contoh ini jika suara yang Anda tentukan dalam SynthesizeSpeech panggilan memiliki kode bahasa yang sama (en-US).

      catatan

      Anda dapat menggunakan DescribeVoices operasi untuk menemukan kode bahasa yang terkait dengan suara.

       

    • alphabetAtribut menentukanIPA, yang berarti bahwa alfabet fonetik internasional (IPA) digunakan untuk pengucapan. IPAadalah salah satu huruf untuk menulis pengucapan. Amazon Polly juga mendukung Extended Speech Assessment Methods Phonetic Alphabet (X-). SAMPA

       

  • <lexeme>Elemen menggambarkan pemetaan antara <grapheme> (yaitu, representasi tekstual dari kata) dan. <alias>

Untuk menguji leksikon ini, lakukan hal berikut:

  1. Simpan leksikon sebagaiexample.pls.

  2. Jalankan put-lexicon AWS CLI perintah untuk menyimpan leksikon (dengan namaw3c), di wilayah us-east-2.

    aws polly put-lexicon \ --name w3c \ --content file://example.pls
  3. Jalankan synthesize-speech perintah untuk mensintesis teks sampel ke aliran audio (speech.mp3), dan tentukan lexicon-name parameter opsional.

    aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
  4. Mainkan hasilnyaspeech.mp3, dan perhatikan bahwa kata W3C dalam teks digantikan oleh World Wide Web Consortium.

Contoh leksikon sebelumnya menggunakan alias. IPAAlfabet yang disebutkan dalam leksikon tidak digunakan. Leksikon berikut menentukan pengucapan fonetik menggunakan <phoneme> elemen dengan alfabet. IPA

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>pecan</grapheme> <phoneme>pɪˈkɑːn</phoneme> </lexeme> </lexicon>

Ikuti langkah yang sama untuk menguji leksikon ini. Pastikan Anda menentukan teks input yang memiliki kata “pecan” (misalnya, “Pecan pie is delicious”).

Lihat sumber daya berikut untuk contoh kode tambahan untuk PutLexicon API operasi:

AWS CLI - multiple lexemes

Dengan Amazon Polly, Anda dapat menggunakan PutLexicon untuk menyimpan leksikon pengucapan di AWS Wilayah tertentu untuk akun Anda. Kemudian, Anda dapat menentukan satu atau lebih leksikon yang disimpan ini dalam SynthesizeSpeech permintaan Anda yang ingin Anda terapkan sebelum layanan mulai mensintesis teks. Untuk informasi selengkapnya, lihat Mengelola leksikon.

Dalam contoh ini, leksem yang Anda tentukan dalam leksikon berlaku secara eksklusif untuk teks input untuk sintesis. Pertimbangkan leksikon berikut:

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme> <lexeme> <grapheme>Consortium</grapheme> <alias>Community</alias> </lexeme> </lexicon>

Leksikon menentukan tiga leksem, dua di antaranya mendefinisikan alias untuk grafem W3C sebagai berikut:

  • Elemen <lexeme > pertama mendefinisikan alias (World Wide Web Consortium).

  • Yang kedua <lexeme> mendefinisikan alias alternatif (WWWKonsorsium).

Amazon Polly menggunakan pengganti pertama untuk setiap grafem tertentu dalam leksikon.

Yang ketiga <lexeme> mendefinisikan pengganti (Komunitas) untuk kata Konsorsium.

Pertama, mari kita uji leksikon ini. Misalkan Anda ingin mensintesis teks sampel berikut ke file audio (speech.mp3), dan Anda menentukan leksikon dalam panggilan ke. SynthesizeSpeech

The W3C is a Consortium

SynthesizeSpeechpertama menerapkan leksikon sebagai berikut:

  • Sesuai leksem pertama, kata W3C direvisi menjadi World Wide Web Consortium. Teks yang direvisi muncul sebagai berikut:

    The World Wide Web Consortium is a Consortium
  • Alias yang didefinisikan dalam leksem ketiga hanya berlaku untuk kata Konsorsium yang merupakan bagian dari teks asli, menghasilkan teks berikut:

    The World Wide Web Consortium is a Community.

Anda dapat menguji ini menggunakan AWS CLI sebagai berikut:

  1. Simpan leksikon sebagaiexample.pls.

  2. Jalankan put-lexicon perintah untuk menyimpan leksikon dengan nama w3c di wilayah us-east-2.

    aws polly put-lexicon \ --name w3c \ --content file://example.pls
  3. Jalankan list-lexicons perintah untuk memverifikasi bahwa leksikon w3c ada dalam daftar leksikon yang dikembalikan.

    aws polly list-lexicons
  4. Jalankan synthesize-speech perintah untuk mensintesis teks sampel ke file audio (speech.mp3), dan tentukan lexicon-name parameter opsional.

    aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
  5. Putar speech.mp3 file yang dihasilkan untuk memverifikasi bahwa ucapan yang disintesis mencerminkan perubahan teks.

Lihat sumber daya berikut untuk contoh kode tambahan untuk PutLexicon API operasi: