Transcriptions alternatives - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Transcriptions alternatives

Lors de laAmazon Transcribe transcription audio, il crée différentes versions de la même transcription et attribue un score de confiance à chaque version. Dans une transcription classique, vous n'obtenez que la version ayant le score de confiance le plus élevé.

Si vous activez les transcriptions alternatives,Amazon Transcribe renvoie d'autres versions de votre transcription présentant des niveaux de confiance inférieurs. Vous pouvez choisir de renvoyer jusqu'à 10 transcriptions alternatives. Si vous spécifiez un nombre d'alternatives supérieur à celuiAmazon Transcribe indiqué, seul le nombre réel d'alternatives est renvoyé.

Toutes les alternatives se trouvent dans le même fichier de sortie de transcription et sont présentées au niveau du segment. Les segments sont des pauses naturelles du discours, telles qu'un changement de haut-parleur ou une pause dans le son.

Les transcriptions alternatives ne sont disponibles que pour les transcriptions par lots.

Votre sortie de transcription est structurée comme suit : Les ellipses (... ) dans les exemples de code indiquent où le contenu a été supprimé par souci de concision.

  1. Transcription finale complète pour un segment donné.

    "results": { "language_code": "en-US", "transcripts": [ { "transcript": "The amazon is the largest rainforest on the planet." } ],
  2. Un score de confiance pour chaque mot de latranscript section précédente.

    "items": [ { "start_time": "1.15", "end_time": "1.35", "alternatives": [ { "confidence": "1.0", "content": "The" } ], "type": "pronunciation" }, { "start_time": "1.35", "end_time": "2.05", "alternatives": [ { "confidence": "1.0", "content": "amazon" } ], "type": "pronunciation" },
  3. Vos transcriptions alternatives se trouvent dans lasegments partie de votre sortie de transcription. Les alternatives pour chaque segment sont classées par score de confiance décroissant.

    "segments": [ { "start_time": "1.04", "end_time": "5.065", "alternatives": [ { ... "transcript": "The amazon is the largest rain forest on the planet.", "items": [ { "start_time": "1.15", "confidence": "1.0", "end_time": "1.35", "type": "pronunciation", "content": "The" }, ... { "start_time": "3.06", "confidence": "0.0037", "end_time": "3.38", "type": "pronunciation", "content": "rain" }, { "start_time": "3.38", "confidence": "0.0037", "end_time": "3.96", "type": "pronunciation", "content": "forest" },
  4. Un statut à la fin de la sortie de votre transcription.

    "status": "COMPLETED" }

Demande de transcriptions alternatives

Vous pouvez demander des transcriptions alternatives à l'aide des AWS Management ConsoleAWS CLI, ou AWSdes SDK ; consultez les exemples suivants :

  1. Connectez-vous à AWS Management Console.

  2. Dans le volet de navigation, choisissez Tâches de transcription, puis sélectionnez Créer une tâche (en haut à droite). La page Spécifier les détails de la tâche s'ouvre.

    Amazon Transcribepage « Spécifier les détails du poste » de la console. Dans le panneau « Paramètres de la tâche », vous pouvez spécifier le nom de votre Job de transcription, sélectionner un type de modèle et spécifier vos paramètres de langue.
  3. Remplissez tous les champs que vous souhaitez inclure sur la page Spécifier les détails du poste, puis sélectionnez Suivant. Vous accédez alors à la page Configurer la tâche - facultative.

    Sélectionnez Résultats alternatifs et spécifiez le nombre maximum de résultats de transcription alternatifs que vous souhaitez inclure dans votre transcription.

    Amazon Transcribepage « Configurer la tâche » de la console. Dans le panneau « Paramètres audio », vous pouvez activer les résultats alternatifs et spécifier le nombre maximum d'alternatives que vous souhaitez inclure dans votre sortie de transcription.
  4. Sélectionnez Créer une tâche pour exécuter votre tâche de transcription.

Cet exemple utilise la start-transcription-jobcommande et leShowAlternatives paramètre. Pour plus d'informations, consultez StartTranscriptionJob et ShowAlternatives.

Notez que si vous incluezShowAlternatives=true dans votre demande, vous devez également inclureMaxAlternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings ShowAlternatives=true,MaxAlternatives=4

Voici un autre exemple d'utilisation de la start-transcription-jobcommande et d'un corps de requête qui inclut des transcriptions alternatives.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://filepath/my-first-alt-transcription-job.json

Le fichier my-first-alt-transcription-job.json contient le corps de requête suivant.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 4 } }

L'exemple suivant utilise leAWS SDK for Python (Boto3) pour demander des transcriptions alternatives en utilisant l'ShowAlternativesargument de la méthode start_transcription_job. Pour plus d'informations, consultez StartTranscriptionJob et ShowAlternatives.

Pour des exemples supplémentaires d'utilisationAWS des SDK, y compris des exemples spécifiques à des fonctionnalités, des scénarios et des exemples interservices, consultez leExemples de code pour Amazon Transcribe à l'aide de kits de développement logiciel AWS chapitre.

Notez que si vous incluez'ShowAlternatives':True dans votre demande, vous devez également inclureMaxAlternatives.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'ShowAlternatives':True, 'MaxAlternatives':4 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)