Transcription d'un fichier audio d'une dictée médicale - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Transcription d'un fichier audio d'une dictée médicale

Utilisez une tâche de transcription par lots pour transcrire les fichiers audio des conversations médicales. Vous pouvez l'utiliser pour transcrire un dialogue clinicien-patient. Vous pouvez démarrer une tâche de transcription par lots dans l'StartMedicalTranscriptionJobAPI ou dans leAWS Management Console.

Lorsque vous démarrez une tâche de transcription médicale avec l'StartMedicalTranscriptionJobAPI, vous spécifiezPRIMARYCARE la valeur duSpecialty paramètre.

Pour transcrire un dialogue clinicien-patient (AWS Management Console)

Pour utiliser leAWS Management Console pour transcrire un dialogue clinicien-patient, créez une tâche de transcription et choisissez Conversation pour le type d'entrée audio.

  1. Connectez-vous à AWS Management Console.

  2. Dans le panneau de navigation, sousAmazon Transcribe Medical, sélectionnez Tâches de transcription.

  3. Choisissez Create job (Créer une tâche).

  4. Sur la page Spécifier les détails de la Job, sous Paramètres de la tâche, spécifiez les informations suivantes.

    1. Nom : nom de la tâche de transcription.

    2. Type d'entrée audio : dictée

  5. Pour les autres champs, spécifiez l'Amazon S3emplacement de votre fichier audio et l'endroit où vous souhaitez stocker la sortie de votre travail de transcription.

  6. Choisissez Suivant.

  7. Sélectionnez Create (Créer).

Pour transcrire une conversation médicale à l'aide d'une tâche de transcription par lots (API)
  • Pour l'StartMedicalTranscriptionJobAPI, spécifiez ce qui suit.

    1. PourMedicalTranscriptionJobName, spécifiez un nom unique dans votreCompte AWS.

    2. PourLanguageCode, spécifiez le code de langue qui correspond à la langue parlée dans votre fichier audio et à la langue de votre filtre de vocabulaire.

    3. Dans leMediaFileUri paramètre de l'Mediaobjet, spécifiez le nom du fichier audio que vous souhaitez transcrire.

    4. PourSpecialty, spécifiez la spécialité médicale du clinicien qui parle dans le fichier audio.

    5. Pour Type, spécifiez DICTATION.

    6. PourOutputBucketName, spécifiez leAmazon S3 compartiment dans lequel stocker les résultats de transcription.

    Voici un exemple de demande qui utilise leAWS SDK for Python (Boto3) pour transcrire la dictée médicale d'un clinicien de laPRIMARYCARE spécialité.

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

L'exemple de code suivant montre les résultats de transcription d'une dictée médicale.

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
Pour activer le partitionnement des haut-parleurs dans une tâche de transcription par lots (AWS CLI)
  • Exécutez le code suivant.

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    Le code suivant affiche le contenu deexample-start-command.json.

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }