As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Carregando um léxico
Os léxicos que você usa devem estar em conformidade com a recomendação do W3C da Especificação de Léxico de Pronúncia (). PLS Para obter mais informações, consulte Especificação do Léxico de Pronúncia (PLS) Versão 1.0 no site
- Console - Lexicons tab
-
Para usar um léxico de pronúncia, é preciso primeiro fazer o upload. Há dois locais no console do qual você pode fazer upload de um léxico: a guia Text-to-Speech e a guia Lexicons.
Os processos a seguir descrevem como adicionar léxicos que você pode usar para personalizar como palavras e frases incomuns ao idioma escolhido são pronunciadas.
Como adicionar um léxico com a guia Léxicos
Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/
-
Escolha a guia Lexicons.
-
Escolha Carregar léxico.
-
Forneça um nome para o léxico e, em seguida, use Escolher um arquivo de léxico para encontrar o léxico a ser carregado. Você só pode fazer upload de PLS arquivos com extensões.pls ou .xml.
-
Escolha Carregar léxico. Se um léxico com o mesmo nome (.pls ou .xml) já existir, o carregamento do léxico substituirá o existente.
- Console - TTS tab
-
Para adicionar um léxico a partir da guia text-to-Speech
Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/
-
Selecione a guia Text-to-Speech.
-
Expanda Configurações adicionais, ative Personalizar pronúncia e escolha Carregar léxico.
-
Forneça um nome para o léxico e, em seguida, use Escolher um arquivo de léxico para encontrar o léxico a ser carregado. Você só pode usar PLS arquivos com extensões.pls ou .xml.
-
Escolha Carregar léxico. Se um léxico com o mesmo nome (seja arquivo .pls ou .xml) já existir, carregar o léxico substituirá o existente.
- AWS CLI - one lexeme
-
Com o Amazon Polly, você pode usar PutLexicon para armazenar léxicos de pronúncia em uma AWS região específica para sua conta. Em seguida, você pode especificar um ou mais desses léxico armazenados na sua solicitação SynthesizeSpeech que você deseja aplicar antes de o serviço começar a sintetizar o texto. Para obter mais informações, consulte Gerenciando léxicos.
Considere o seguinte PLS léxico compatível com o W3C.
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> </lexicon>
Observe o seguinte:
-
Os dois atributos especificados no elemento
<lexicon>
:-
O atributo
xml:lang
especifica o código do idioma,en-US
, ao qual o léxico se aplica. O Amazon Polly pode usar esse léxico de exemplo se a voz que você especificar na chamadaSynthesizeSpeech
tiver o mesmo código de idioma (en-US).nota
Você pode usar a operação
DescribeVoices
para localizar o código de idioma associado a uma voz. -
O
alphabet
atributo especificaIPA
, o que significa que o alfabeto do Alfabeto Fonético Internacional (IPA) é usado para pronúncias. IPAé um dos alfabetos para escrever pronúncias. O Amazon Polly também oferece suporte ao Alfabeto Fonético dos Métodos de Avaliação de Fala Estendida (X-). SAMPA
-
-
O elemento
<lexeme>
descreve o mapeamento entre<grapheme>
(ou seja, uma representação textual da palavra) e<alias>
.
Para testar esse léxico, faça o seguinte:
-
Salve o léxico como
example.pls
. -
Execute o
put-lexicon
AWS CLI comando para armazenar o léxico (com o nomew3c
) na região us-east-2.aws polly put-lexicon \ --name w3c \ --content file://example.pls
-
Execute o comando
synthesize-speech
para sintetizar o texto de amostra em um fluxo de áudio (speech.mp3
) e especifique parâmetrolexicon-name
opcional.aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
-
Reproduza o
speech.mp3
resultante e observe que a palavra W3C no texto é substituída por World Wide Web Consortium.
O léxico do exemplo anterior usa um alias. O IPA alfabeto mencionado no léxico não é usado. O léxico a seguir especifica uma pronúncia fonética usando o elemento com o
<phoneme>
alfabeto. IPA<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>pecan</grapheme> <phoneme>pɪˈkɑːn</phoneme> </lexeme> </lexicon>
Siga as mesmas etapas para testar esse léxico. Certifique-se de especificar o texto de entrada que tenha a palavra “pecan” (por exemplo, “Torta de noz-pecã é deliciosa”).
Consulte os seguintes recursos para obter exemplos de código adicionais para a PutLexicon API operação:
-
Amostra de Java: PutLexicon
-
Amostra de Python (Boto3): PutLexicon
-
- AWS CLI - multiple lexemes
-
Com o Amazon Polly, você pode usar PutLexicon para armazenar léxicos de pronúncia em uma AWS região específica para sua conta. Em seguida, você pode especificar um ou mais desses léxico armazenados na sua solicitação SynthesizeSpeech que você deseja aplicar antes de o serviço começar a sintetizar o texto. Para obter mais informações, consulte Gerenciando léxicos.
Neste exemplo, o lexema que você especificar no léxico se aplica exclusivamente ao texto de entrada para a síntese. Considere o seguinte léxico:
<?xml version="1.0" encoding="UTF-8"?> <lexicon version="1.0" xmlns="http://www.w3.org/2005/01/pronunciation-lexicon" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.w3.org/2005/01/pronunciation-lexicon http://www.w3.org/TR/2007/CR-pronunciation-lexicon-20071212/pls.xsd" alphabet="ipa" xml:lang="en-US"> <lexeme> <grapheme>W3C</grapheme> <alias>World Wide Web Consortium</alias> </lexeme> <lexeme> <grapheme>W3C</grapheme> <alias>WWW Consortium</alias> </lexeme> <lexeme> <grapheme>Consortium</grapheme> <alias>Community</alias> </lexeme> </lexicon>
O léxico especifica três lexemas, dois dos quais definem um alias para o grafema W3C, da seguinte forma:
-
O primeiro elemento
<lexeme
> define um alias (World Wide Web Consortium). -
O segundo
<lexeme>
define um alias alternativo (WWWConsórcio).
O Amazon Polly usa a primeira substituição para determinado grafema em um léxico.
O terceiro
<lexeme>
define uma substituição (Community) para a palavra Consortium.Primeiro, vamos testar esse léxico. Suponha que você deseja sintetizar o texto de exemplo a seguir para um arquivo de áudio (
speech.mp3
) e especifica o léxico em uma chamada paraSynthesizeSpeech
.The W3C is a Consortium
O
SynthesizeSpeech
primeiro aplica a léxico da seguinte forma:-
De acordo com o primeiro lexema, a palavra W3C é revisada como World Wide Web Consortium. O texto revisado aparece da seguinte forma:
The World Wide Web Consortium is a Consortium
-
O alias definido no terceiro lexema se aplica somente à palavra Consortium, que foi parte do texto original, resultando no texto a seguir:
The World Wide Web Consortium is a Community.
Você pode testar isso usando o AWS CLI seguinte:
Salve o léxico como
example.pls
.Execute o comando
put-lexicon
para armazenar o léxico com o nome w3c na região us-east-2.aws polly put-lexicon \ --name w3c \ --content file://example.pls
Execute o comando
list-lexicons
para verificar se o léxico w3c está na lista de léxicos retornados.aws polly list-lexicons
-
Execute o comando
synthesize-speech
para sintetizar o texto de amostra para um arquivo de áudio (speech.mp3
) e especifique parâmetrolexicon-name
opcional.aws polly synthesize-speech \ --text 'W3C is a Consortium' \ --voice-id Joanna \ --output-format mp3 \ --lexicon-names="w3c" \ speech.mp3
Reproduza o arquivo
speech.mp3
resultante para verificar se a fala sintetizada reflete as alterações no texto.
Consulte os seguintes recursos para obter exemplos de código adicionais para a PutLexicon API operação:
-
Amostra de Java: PutLexicon
-
Amostra de Python (Boto3): PutLexicon
-