Transcription d’un fichier audio d’une dictée médicale

Utilisez une tâche de transcription par lots pour transcrire les fichiers audio de conversations médicales. Vous pouvez l’utiliser pour transcrire un dialogue entre un médecin et son patient. Vous pouvez démarrer une tâche de transcription par lots dans l’API StartMedicalTranscriptionJob ou la AWS Management Console.

Lorsque vous démarrez une tâche de transcription médicale avec l’API StartMedicalTranscriptionJob, vous spécifiez PRIMARYCARE comme valeur du paramètre Specialty.

Pour transcrire un dialogue entre un médecin et son patient (AWS Management Console)

Pour utiliser le AWS Management Console pour transcrire un dialogue clinicien-patient, créez une tâche de transcription et choisissez le type d'entrée Conversation for Audio.

Connectez-vous à la AWS Management Console.
Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez Transcription jobs.
Choisissez Créer une tâche.
Sur la page Spécifier les détails de la tâche, sous Paramètres de la tâche, indiquez les valeurs suivantes :
1. Nom : nom de la tâche de transcription.
2. Type d’entrée audio : Dictée
Pour les autres champs, spécifiez l' Amazon S3 emplacement de votre fichier audio et l'endroit où vous souhaitez stocker le résultat de votre travail de transcription.
Choisissez Suivant.
Sélectionnez Create (Créer).

Pour transcrire une conversation médicale à l’aide d’une tâche de transcription par lots (API)

Pour l’API StartMedicalTranscriptionJob, spécifiez ce qui suit.

Pour MedicalTranscriptionJobName, spécifiez un nom unique dans votre Compte AWS.
Pour LanguageCode, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio et la langue de votre filtre de vocabulaire.
Dans le paramètre MediaFileUri de l’objet Media, spécifiez le nom du fichier audio que vous souhaitez transcrire.
Pour Specialty, spécifiez la spécialité médicale du médecin qui parle dans le fichier audio.
Pour Type, spécifiez DICTATION.
Pour OutputBucketName, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription.

Voici un exemple de demande qui utilise le AWS SDK for Python (Boto3) pour transcrire une dictée médicale d'un clinicien de la spécialité. PRIMARYCARE



 from __future__ import print_function
 import time
 import boto3
 transcribe = boto3.client('transcribe')
 job_name = "my-first-med-transcription-job"
 job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
 transcribe.start_medical_transcription_job(
     MedicalTranscriptionJobName = job_name,
     Media = {
        'MediaFileUri': job_uri
     },     
     OutputBucketName = 'amzn-s3-demo-bucket',                                
     OutputKey = 'my-output-files/', 
     LanguageCode = 'en-US',
     Specialty = 'PRIMARYCARE',
     Type = 'DICTATION'
 )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

L’exemple de code suivant montre les résultats de transcription d’une dictée médicale.



{
    "jobName": "dictation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... came for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "came"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}

Pour activer le partitionnement des locuteurs dans une tâche de transcription par lots (AWS CLI)

Exécutez le code suivant.



                    
aws transcribe start-medical-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

Le code suivant affiche le contenu du fichier example-start-command.json.


{
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
      "Media": {
      "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "amzn-s3-demo-bucket",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",  
      "Specialty": "PRIMARYCARE",
      "Type": "DICTATION"
}

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Transcription d’une dictée médicale

Transcription d’une dictée médicale en streaming