Transcription d’un fichier audio d’une dictée médicale - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Transcription d’un fichier audio d’une dictée médicale

Utilisez une tâche de transcription par lots pour transcrire les fichiers audio de conversations médicales. Vous pouvez l’utiliser pour transcrire un dialogue entre un médecin et son patient. Vous pouvez démarrer une tâche de transcription par lots dans l’API StartMedicalTranscriptionJob ou la AWS Management Console.

Lorsque vous démarrez une tâche de transcription médicale avec l’API StartMedicalTranscriptionJob, vous spécifiez PRIMARYCARE comme valeur du paramètre Specialty.

Pour transcrire un dialogue entre un médecin et son patient (AWS Management Console)

Pour utiliser le AWS Management Console pour transcrire un dialogue clinicien-patient, créez une tâche de transcription et choisissez le type d'entrée Conversation for Audio.

  1. Connectez-vous à la AWS Management Console.

  2. Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez Transcription jobs.

  3. Choisissez Créer une tâche.

  4. Sur la page Spécifier les détails de la tâche, sous Paramètres de la tâche, indiquez les valeurs suivantes :

    1. Nom : nom de la tâche de transcription.

    2. Type d’entrée audio : Dictée

  5. Pour les autres champs, spécifiez l' Amazon S3 emplacement de votre fichier audio et l'endroit où vous souhaitez stocker le résultat de votre travail de transcription.

  6. Choisissez Suivant.

  7. Sélectionnez Create (Créer).

Pour transcrire une conversation médicale à l’aide d’une tâche de transcription par lots (API)
  • Pour l’API StartMedicalTranscriptionJob, spécifiez ce qui suit.

    1. Pour MedicalTranscriptionJobName, spécifiez un nom unique dans votre Compte AWS.

    2. Pour LanguageCode, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio et la langue de votre filtre de vocabulaire.

    3. Dans le paramètre MediaFileUri de l’objet Media, spécifiez le nom du fichier audio que vous souhaitez transcrire.

    4. Pour Specialty, spécifiez la spécialité médicale du médecin qui parle dans le fichier audio.

    5. Pour Type, spécifiez DICTATION.

    6. Pour OutputBucketName, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription.

    Voici un exemple de demande qui utilise le AWS SDK for Python (Boto3) pour transcrire une dictée médicale d'un clinicien de la spécialité. PRIMARYCARE

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

L’exemple de code suivant montre les résultats de transcription d’une dictée médicale.

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
Pour activer le partitionnement des locuteurs dans une tâche de transcription par lots (AWS CLI)
  • Exécutez le code suivant.

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    Le code suivant affiche le contenu du fichier example-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac" }, "OutputBucketName": "amzn-s3-demo-bucket", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }