Création de fichiers audio longs - Amazon Polly

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Création de fichiers audio longs

Vous pouvez utiliser la console Amazon Polly pour créer de longs discours à l'aide de la synthèse asynchrone avec les mêmes fonctionnalités que celles que vous pouvez utiliser avec le. AWS CLI Cette opération est effectuée via l'onglet Text-to-Speech (Synthèse vocale), comme n'importe quelle autre synthèse.

Console

L'autre fonctionnalité de synthèse asynchrone est également disponible via la console. L'onglet S3 synthesis tasks (Tâches de synthèse S3) reflète la fonctionnalité ListSpeechSynthesisTasks. Il affiche toutes les tâches enregistrées dans le compartiment S3 et vous permet de les filtrer, si vous le souhaitez. Cliquer sur une tâche spécifique permet d'afficher ses détails, reflétant la fonctionnalité GetSpeechSynthesisTask.

Pour synthétiser un texte volumineux à l'aide de la console Amazon Polly
  1. Connectez-vous à la console Amazon Polly AWS Management Console et ouvrez-la à l'adresse. https://console.aws.amazon.com/polly/

  2. Choisissez l'onglet Text-to-Speech (Synthèse vocale). Sélectionnez Long Form comme moteur, le cas échéant.

  3. Lorsque cette option est SSMLactivée ou désactivée, tapez ou collez votre texte dans la zone de saisie.

  4. Choisissez la langue, la région et la voix pour votre texte.

  5. Choisissez Enregistrer dans S3.

    Note

    Les options Télécharger et Écouter sont grisées si la longueur du texte est supérieure à la limite de 3 000 caractères pour le SynthesizeSpeech fonctionnement en temps réel.

  6. La console ouvre un formulaire afin que vous puissiez choisir où stocker le fichier de sortie.

    1. Entrez le nom du compartiment Amazon S3 de destination.

    2. Le cas échéant, renseignez la clé de préfixe de la sortie.

      Note

      La compartiment S3 de sortie doit être accessible en écriture.

    3. Si vous souhaitez être averti lorsque la tâche de synthèse est terminée, fournissez un identifiant de SNS sujet facultatif.

      Note

      Pour utiliser cette option, l'utilisateur actuel de la console SNS doit être ouvert à la publication. Pour plus d'informations, consultez Amazon Simple Notification Service (SNS)

    4. Choisissez Enregistrer dans S3.

Pour récupérer des informations sur vos tâches de synthèse vocale
  1. Dans la console, accédez à l'onglet S3 Synthesis Tasks (Tâches de synthèse S3).

  2. Les tâches sont affichées par ordre de date. Pour filtrer les tâches, par statut, choisissez Tous les statuts, puis choisissez le statut à utiliser.

  3. Pour afficher les détails d'une tâche spécifique, choisissez le Task ID (Identifiant de tâche) associé.

AWS CLI

La fonctionnalité de synthèse asynchrone d'Amazon Polly en utilise trois SpeechSynthesisTask APIs pour traiter de grandes quantités de texte :

  • StartSpeechSynthesisTask : lance une nouvelle tâche de synthèse.

  • GetSpeechSynthesisTask : renvoie des détails concernant une tâche de synthèse précédemment soumise.

  • ListSpeechSynthesisTasks : répertorie toutes les tâches de synthèse soumises.

Synthétisation de textes volumineux (StartSpeechSynthesisTask)

Si vous souhaitez créer un fichier audio plus volumineux que celui que vous pouvez créer avec l'opération SynthesizeSpeech en temps réel, utilisez l'opération StartSpeechSynthesisTask. Outre les arguments nécessaires à l'SynthesizeSpeechopération, le nom d'un compartiment Amazon S3 est StartSpeechSynthesisTask également requis. Deux autres arguments facultatifs sont également disponibles : un préfixe clé pour le fichier de sortie et un préfixe ARN pour une SNS rubrique si vous souhaitez recevoir une notification de statut concernant la tâche.

  • OutputS3BucketName: nom du compartiment Amazon S3 dans lequel la synthèse doit être téléchargée. Ce compartiment doit se trouver dans la même région que le service Amazon Polly. En outre, l'IAMutilisateur utilisé pour effectuer l'appel doit avoir accès au compartiment. [Obligatoire]

  • OutputS3KeyPrefix : préfixe de clé pour le fichier de sortie. Utilisez ce paramètre si vous souhaitez enregistrer le fichier vocal de sortie dans une clé personnalisée semblable à un répertoire dans votre bucket. [Facultatif]

  • SnsTopicArn: SNS rubrique ARN à utiliser si vous souhaitez recevoir des notifications concernant le statut de la tâche. Ce SNS sujet doit se trouver dans la même région que le service Amazon Polly. En outre, l'IAMutilisateur utilisé pour passer l'appel doit avoir accès au sujet. [Facultatif]

Par exemple, l'exemple suivant peut être utilisé pour exécuter la start-speech-synthesis-task AWS CLI commande dans la région USA Est (Ohio) :

L' AWS CLI exemple suivant est formaté pour Unix, Linux et macOS. Pour Windows, remplacez le caractère de continuation Unix (\) à la fin de chaque ligne par un curseur (^) et utilisez des guillemets complets («) autour du texte saisi par des guillemets simples (') pour les balises intérieures.

aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

Cette opération génèrera une réponse similaire à celle de l'exemple ci-dessous :

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

L'opération start-speech-synthesis-task renvoie plusieurs nouveaux champs :

  • OutputUri : emplacement de votre fichier vocal de sortie.

  • TaskId: identifiant unique pour la tâche de synthèse vocale générée par Amazon Polly.

  • CreationTime : horodatage de la date de soumission initiale de la tâche.

  • RequestCharacters : nombre de caractères facturables dans la tâche.

  • TaskStatus : fournit des informations concernant l'état de la tâche soumise.

    Une fois votre tâche soumise, l'état initial affiche scheduled. Lorsqu'Amazon Polly commence à traiter la tâche, le statut passe à inProgress et plus tard, à completed ou. failed Si la tâche échoue, un message d'erreur sera renvoyé lors de l'appel de l' ListSpeechSynthesisTasks opération GetSpeechSynthesisTask or.

Lorsque la tâche est terminée, le fichier vocal s'ajoute à l'emplacement spécifié dans OutputUri.

Récupération d'informations sur votre tâche de synthèse vocale

Vous pouvez obtenir des informations sur une tâche, telles que les erreurs, l'état et d'autres détails, à l'aide de l'opération GetSpeechSynthesisTask. Pour ce faire, vous aurez besoin du task-id renvoyé par l'opération StartSpeechSynthesisTask.

Par exemple, l'exemple suivant peut être utilisé pour exécuter la get-speech-synthesis-task AWS CLI commande :

aws polly get-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/" \ --task-id task identifier

Vous pouvez également afficher toutes les tâches de synthèse vocale que vous avez exécutées dans la région actuelle à l'aide de l'opération ListSpeechSynthesisTasks.

Par exemple, l'exemple suivant peut être utilisé pour exécuter la list-speech-synthesis-tasks AWS CLI commande :

aws polly list-speech-synthesis-tasks \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/"