Criar arquivos de áudio longos - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Criar arquivos de áudio longos

É possível usar o console do Amazon Polly para criar falas longas usando a síntese assíncrona com a mesma funcionalidade que você pode usar com a AWS CLI. Isso é feito usando a guia Text-to-Speech (Texto para fala) da mesma maneira que qualquer outra síntese.

Console

A outra funcionalidade de síntese assíncrona também está disponível pelo console. A guia S3 synthesis tasks (Tarefas de síntese do S3) reflete a funcionalidade ListSpeechSynthesisTasks, exibindo todas as tarefas salvas no bucket do S3 e permitindo filtrá-las, se desejar. Clicar em uma única tarefa específica mostra seus detalhes, refletindo a funcionalidade GetSpeechSynthesisTask.

Para sintetizar um texto grande usando o console Amazon Polly
  1. Faça login no AWS Management Console e abra o console do Amazon Polly em. https://console.aws.amazon.com/polly/

  2. Selecione a guia Text-to-Speech. Selecione Formato longo como o mecanismo, se apropriado.

  3. Com a SSMLtecla ativada ou desativada, digite ou cole o texto na caixa de entrada.

  4. Selecione o idioma, a região e a voz para seu texto.

  5. Escolha Salvar no S3.

    nota

    As opções Download e Listen ficam acinzentadas se o tamanho do texto estiver acima do limite de 3.000 caracteres para a operação em tempo realSynthesizeSpeech.

  6. O console abre um formulário para que você possa escolher onde armazenar o arquivo de saída.

    1. Preencha o nome do bucket do Amazon S3 de destino.

    2. Se preferir, preencha o prefixo de chaves da saída.

      nota

      A bucket do S3 de saída deve ser gravável.

    3. Se você quiser ser notificado quando a tarefa de síntese for concluída, forneça um identificador de SNS tópico opcional.

      nota

      O SNS deve estar aberto para publicação pelo usuário atual do console para usar essa opção. Para obter mais informações, consulte Amazon Simple Notification Service (SNS)

    4. Escolha Salvar no S3.

Para recuperar informações sobre suas tarefas de síntese de fala
  1. No console, selecione a guia Tarefas de síntese do S3.

  2. As tarefas são exibidas por ordem de data. Para filtrar as tarefas por status, escolha Todos os status e defina o status a ser usado.

  3. Para visualizar os detalhes de uma tarefa específica, selecione o Task ID (ID da tarefa) vinculado.

AWS CLI

A funcionalidade de síntese assíncrona do Amazon Polly usa três SpeechSynthesisTask APIs para trabalhar com grandes quantidades de texto:

  • StartSpeechSynthesisTask: começa uma nova tarefa de síntese.

  • GetSpeechSynthesisTask: retorna detalhes sobre uma tarefa de síntese enviada anteriormente.

  • ListSpeechSynthesisTasks: lista todas as tarefas de síntese enviadas.

Sintetizar grandes quantidades de texto (StartSpeechSynthesisTask)

Quando quiser criar um arquivo de áudio maior do que pode criar com a operação SynthesizeSpeech em tempo real, use a operação StartSpeechSynthesisTask. Além dos argumentos necessários para a operação SynthesizeSpeech, a StartSpeechSynthesisTask também exige o nome de um bucket do Amazon S3. Dois outros argumentos opcionais também estão disponíveis: um prefixo de chave para o arquivo de saída e o ARN para um SNS tópico se você quiser receber uma notificação de status sobre a tarefa.

  • OutputS3BucketName: o nome do bucket do Amazon S3 para o qual deve ser feito o upload da síntese. Esse bucket deve estar na mesma região que o serviço do Amazon Polly. Além disso, o IAM usuário usado para fazer a chamada deve ter acesso ao bucket. [Obrigatório]

  • OutputS3KeyPrefix: prefixo de chaves para o arquivo de saída. Use este parâmetro se deseja salvar o arquivo de saída da fala em uma chave personalizada como um diretório em seu bucket. [Opcional]

  • SnsTopicArn: o SNS tópico ARN a ser usado se você quiser receber notificações sobre o status da tarefa. Esse SNS tópico deve estar na mesma região do serviço Amazon Polly. Além disso, o IAM usuário que está sendo usado para fazer a chamada deve ter acesso ao tópico. (Opcional)

Por exemplo, o exemplo a seguir pode ser usado para executar o start-speech-synthesis-task AWS CLI comando na região Leste dos EUA (Ohio):

O AWS CLI exemplo a seguir está formatado para Unix, Linux e macOS. Para Windows, substitua o caractere de continuação Unix de barra invertida (\) no final de cada linha por um acento circunflexo (^) e use aspas completas (") ao redor do texto de entrada com aspas simples (') para tags internas.

aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

Isso resultará em uma resposta semelhante a esta:

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

A operação start-speech-synthesis-task retorna diversos campos novos:

  • OutputUri: o local do seu arquivo de saída da fala.

  • TaskId: um identificador exclusivo para a tarefa de síntese de fala gerado pelo Amazon Polly.

  • CreationTime: um time stamp de quando a tarefa foi inicialmente enviada.

  • RequestCharacters: o número de caracteres faturáveis na tarefa.

  • TaskStatus: fornece informações sobre o status da tarefa enviada.

    Quando a tarefa for enviada, o status inicial será exibido como scheduled. Quando o Amazon Polly começar a processar a tarefa, o status será alterado para inProgress e depois para completed ou failed. Se a tarefa falhar, uma mensagem de erro será retornada ao chamar a ListSpeechSynthesisTasks operação GetSpeechSynthesisTask ou.

Quando a tarefa for concluída, o arquivo da fala estará disponível no local especificado em OutputUri.

Recuperar informações sobre sua tarefa de síntese de fala

É possível obter informações sobre uma tarefa, como erros, status e assim por diante, usando a operação GetSpeechSynthesisTask. Para fazer isso, você precisará do task-id retornado pelo StartSpeechSynthesisTask.

Por exemplo, o exemplo a seguir pode ser usado para executar o get-speech-synthesis-task AWS CLI comando:

aws polly get-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/" \ --task-id task identifier

Também é possível listar todas as tarefas de síntese de fala que você executou na região atual usando a operação ListSpeechSynthesisTasks.

Por exemplo, o exemplo a seguir pode ser usado para executar o list-speech-synthesis-tasks AWS CLI comando:

aws polly list-speech-synthesis-tasks \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/"