Ein Lexikon hochladen - Amazon Polly

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Ein Lexikon hochladen

Die von Ihnen verwendeten Lexika müssen der W3C-Empfehlung Pronunciation Lexicon Specification () entsprechen. PLS Weitere Informationen finden Sie unter Pronunciation Lexicon Specification (PLS) Version 1.0 auf der W3C-Website.

Console - Lexicons tab

Zum Verwenden eines Aussprachelexikons müssen Sie es zunächst hochladen. Es gibt zwei Positionen auf der Konsole, von denen Sie ein Lexikon hochladen können, die Registerkarte Text-to-Speech und die Registerkarte Lexicons.

In den folgenden Prozessen wird beschrieben, wie Sie Lexika hinzufügen, die Sie verwenden können, um festzulegen, wie Wörter und Sätze ausgesprochen werden, die in der gewählten Sprache seltener vorkommen.

So fügen Sie ein Lexikon über den Tab Lexika hinzu
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Polly Polly-Konsole unter https://console.aws.amazon.com/polly/.

  2. Wählen Sie die Registerkarte Lexicons aus.

  3. Wählen Sie Lexikon hochladen.

  4. Geben Sie einen Namen für das Lexikon ein und klicken Sie dann auf Lexikondatei auswählen, um das hochzuladende Lexikon zu suchen. Sie können nur PLS Dateien mit den Erweiterungen.pls oder .xml hochladen.

  5. Wählen Sie Lexikon hochladen. Existiert bereits ein Lexikon mit demselben Namen (unabhängig davon, ob es sich um eine .pls- oder .xml-Datei handelt), wird durch das Hochladen des Lexikons das bestehende Lexikon überschrieben.

Console - TTS tab
Um text-to-Speech ein Lexikon aus der Registerkarte hinzuzufügen
  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die Amazon Polly Polly-Konsole unter https://console.aws.amazon.com/polly/.

  2. Wählen Sie die Registerkarte Text-to-Speech.

  3. Erweitern Sie Zusätzliche Einstellungen, aktivieren Sie Aussprache anpassen und wählen Sie dann Lexikon hochladen.

  4. Geben Sie einen Namen für das Lexikon ein und klicken Sie dann auf Lexikondatei auswählen, um das hochzuladende Lexikon zu suchen. Sie können nur PLS Dateien mit den Erweiterungen.pls oder .xml verwenden.

  5. Wählen Sie Lexikon hochladen. Existiert bereits ein Lexikon mit demselben Namen (unabhängig davon, ob es sich um eine .pls- oder .xml-Datei handelt), wird durch das Hochladen des Lexikons das bestehende Lexikon überschrieben.

AWS CLI - one lexeme

Mit Amazon Polly können Sie PutLexicon Aussprachelexika in einer bestimmten AWS Region für Ihr Konto speichern. Anschließend können Sie eine oder mehrere dieser gespeicherten Lexika in Ihrer SynthesizeSpeech-Anforderung angeben, die Sie anwenden möchten, bevor der Dienst mit der synthetischen Sprache beginnt. Weitere Informationen finden Sie unter Verwaltung von Lexika.

Stellen Sie sich das folgende PLS W3C-konforme Lexikon vor.

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> </lexicon>

Beachten Sie Folgendes:

  • Im <lexicon>-Element werden die folgenden zwei Attribute angegeben:

    • Das xml:lang Attribut spezifiziert den Sprachcode,en-US, für den das Lexikon gilt. Amazon Polly kann dieses Beispiellexikon verwenden, wenn die Stimme, die Sie im SynthesizeSpeech Anruf angeben, denselben Sprachcode hat (en-US).

      Anmerkung

      Sie können den DescribeVoices-Vorgang verwenden, um nach dem mit einer Stimme verknüpften Sprachcode zu suchen.

       

    • Das alphabet Attribut gibt anIPA, was bedeutet, dass das Alphabet des Internationalen Phonetischen Alphabets (IPA) für die Aussprache verwendet wird. IPAist eines der Alphabete zum Schreiben von Aussprachen. Amazon Polly unterstützt auch das Phonetische Alphabet (X-SAMPA) mit den erweiterten Methoden zur Sprachbeurteilung.

       

  • Das <lexeme>-Element beschreibt die Zuordnung zwischen <grapheme> (d. h. Textdarstellung des Wortes) und <alias>.

Führen Sie zum Testen dieses Lexikons folgende Schritte aus:

  1. Speichern Sie das Lexikon unter dem Namen example.pls.

  2. Führen Sie den put-lexicon AWS CLI Befehl aus, um das Lexikon (mit dem Namenw3c) in der Region us-east-2 zu speichern.

    aws polly put-lexicon \ --name w3c \ --content file://example.pls
  3. Führen Sie den synthesize-speech-Befehl aus, um den Beispieltext synthetisch in einem Audio-Stream (speech.mp3) zu bilden, und geben Sie den optionalenlexicon-name-Parameter an.

    aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
  4. Geben Sie die resultierende speech.mp3-Datei wieder und beachten Sie, dass das Wort W3C in dem Text durch World Wide Web Consortium ersetzt wird.

Im vorherigen Beispiel-Lexikon wird ein Alias verwendet. Das im Lexikon erwähnte IPA Alphabet wird nicht verwendet. Das folgende Lexikon spezifiziert eine phonetische Aussprache unter Verwendung des <phoneme> Elements mit dem Alphabet. IPA

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>pecan</grapheme> <phoneme>pɪˈkɑːn</phoneme> </lexeme> </lexicon>

Führen Sie zum Testen dieses Lexikons die gleichen Schritte aus. Stellen Sie sicher, dass Sie einen Eingabetext angeben, der das Wort „Pekannuss“ enthält (z. B. „Pekannusskuchen ist köstlich“).

Zusätzliche Codebeispiele für diesen Vorgang finden Sie in den PutLexicon API folgenden Ressourcen:

AWS CLI - multiple lexemes

Mit Amazon Polly können Sie PutLexicon Aussprachelexika in einer bestimmten AWS Region für Ihr Konto speichern. Anschließend können Sie eine oder mehrere dieser gespeicherten Lexika in Ihrer SynthesizeSpeech-Anforderung angeben, die Sie anwenden möchten, bevor der Dienst mit der synthetischen Sprache beginnt. Weitere Informationen finden Sie unter Verwaltung von Lexika.

In diesem Beispiel wird das im Lexikon angegebene Lexem nur auf den synthetischen Eingabetext angewendet. Erwägen Sie das folgende Lexikon:

<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme> <lexeme> <grapheme>Consortium</grapheme> <alias>Community</alias> </lexeme> </lexicon>

Das Lexikon gibt drei Lexeme an, von denen zwei einen Alias für das Graphem W3C folgendermaßen definieren:

  • Die erste <lexeme>-Element definiert einen Alias (World Wide Web Consortium).

  • Der zweite <lexeme> definiert einen alternativen Alias (WWWConsortium).

Amazon Polly verwendet den ersten Ersatz für ein beliebiges Graphem in einem Lexikon.

Das dritte <lexeme> definiert eine Ersetzung (Community) für das Wort Consortium.

Testen wir zunächst dieses Lexikon. Nehmen wir an, Sie synthetisieren den folgenden Beispieltext in eine Audiodatei (speech.mp3) und geben das Lexikon in einem Aufruf an SynthesizeSpeech an.

The W3C is a Consortium

SynthesizeSpeech wendet das Lexikon zunächst folgendermaßen an:

  • Wie bei dem ersten Lexem wird das Wort W3C in World Wide Web Consortium geändert. Der geänderte Text wird wie folgt angezeigt:

    The World Wide Web Consortium is a Consortium
  • Der im dritten Lexem angegebene Alias wird nur auf das Wort Consortium angewendet, das Teil des ursprünglichen Texts war, sodass sich folgender Text ergibt:

    The World Wide Web Consortium is a Community.

Sie können dies wie folgt testen AWS CLI :

  1. Speichern Sie das Lexikon unter dem Namen example.pls.

  2. Führen Sie den put-lexicon-Befehl aus, um das Lexikon mit dem Namen w3c in der Region us-east-2 zu speichern.

    aws polly put-lexicon \ --name w3c \ --content file://example.pls
  3. Führen Sie den list-lexicons-Befehl aus, um sicherzustellen, dass das w3c-Lexikon in der Liste der Lexika zurückgegeben wird.

    aws polly list-lexicons
  4. Führen Sie den synthesize-speech-Befehl aus, um den Beispieltext synthetisch in einer Audiodatei (speech.mp3) zu bilden, und geben Sie den optionalen lexicon-name-Parameter an.

    aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
  5. Geben Sie die speech.mp3-Datei wieder, um sicherzustellen, dass die synthetische Sprache die Textänderungen widerspiegelt.

Zusätzliche Codebeispiele für den PutLexicon API Vorgang finden Sie in den folgenden Ressourcen: