Transcription d’un fichier audio à l’aide d’un vocabulaire personnalisé médical - Amazon Transcribe

Transcription d’un fichier audio à l’aide d’un vocabulaire personnalisé médical

Utilisez le StartMedicalTranscriptionJobou AWS Management Console pour démarrer une tâche de transcription qui utilise un vocabulaire personnalisé afin d'améliorer la précision de la transcription.

Connectez-vous à la AWS Management Console.
Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez Transcription jobs.
Choisissez Créer une tâche.
Sur la page Spécifier les détails de la tâche, fournissez des informations sur votre tâche de transcription.
Choisissez Suivant.
Sous Personnalisation, activez Vocabulaire personnalisé.
Sous Sélection du vocabulaire, choisissez un vocabulaire personnalisé.
Sélectionnez Create (Créer).

AWS Management Console

Connectez-vous à la AWS Management Console.
Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez Transcription jobs.
Choisissez Créer une tâche.
Sur la page Spécifier les détails de la tâche, fournissez des informations sur votre tâche de transcription.
Choisissez Suivant.
Sous Personnalisation, activez Vocabulaire personnalisé.
Sous Sélection du vocabulaire, choisissez un vocabulaire personnalisé.
Sélectionnez Create (Créer).

Pour activer le partitionnement de locuteurs dans un fichier audio à l’aide d’une tâche de transcription par lots (API)

Pour l’API StartMedicalTranscriptionJob, spécifiez ce qui suit.
1. Pour MedicalTranscriptionJobName, spécifiez un nom unique dans votre Compte AWS.
2. Pour LanguageCode, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio et la langue de votre filtre de vocabulaire.
3. Pour le paramètre MediaFileUri de l’objet Media, spécifiez le nom du fichier audio que vous souhaitez transcrire.
4. Pour Specialty, spécifiez la spécialité médicale du médecin qui parle dans le fichier audio.
5. Pour Type, spécifiez si le fichier audio est une conversation ou une dictée.
6. Pour OutputBucketName, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription.
7. Pour l’objet Settings, spécifiez ce qui suit :
  1. VocabularyName – Nom de votre vocabulaire personnalisé.

La requête suivante utilise le AWS SDK pour Python (Boto3) pour démarrer une tâche de transcription par lots avec un vocabulaire personnalisé.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

« Hello, World! »

Pour activer le partitionnement de locuteurs dans un fichier audio à l’aide d’une tâche de transcription par lots (API)

Pour l’API StartMedicalTranscriptionJob, spécifiez ce qui suit.
1. Pour MedicalTranscriptionJobName, spécifiez un nom unique dans votre Compte AWS.
2. Pour LanguageCode, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio et la langue de votre filtre de vocabulaire.
3. Pour le paramètre MediaFileUri de l’objet Media, spécifiez le nom du fichier audio que vous souhaitez transcrire.
4. Pour Specialty, spécifiez la spécialité médicale du médecin qui parle dans le fichier audio.
5. Pour Type, spécifiez si le fichier audio est une conversation ou une dictée.
6. Pour OutputBucketName, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription.
7. Pour l’objet Settings, spécifiez ce qui suit :
  1. VocabularyName – Nom de votre vocabulaire personnalisé.

La requête suivante utilise le AWS SDK pour Python (Boto3) pour démarrer une tâche de transcription par lots avec un vocabulaire personnalisé.



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-med-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_medical_transcription_job(
   MedicalTranscriptionJobName = job_name,
   Media = {
       'MediaFileUri': job_uri
   },
   OutputBucketName = 'amzn-s3-demo-bucket',
   OutputKey = 'my-output-files/', 
   LanguageCode = 'en-US',
   Specialty = 'PRIMARYCARE',
   Type = 'CONVERSATION',
   Settings = {
       'VocabularyName': 'example-med-custom-vocab'
       }
 )

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Utilisation d’un fichier texte pour créer un vocabulaire personnalisé médical

Transcription d’un flux en temps réel à l’aide d’un vocabulaire personnalisé médical

Sélectionner vos préférences de cookies

Personnaliser les préférences de cookies

Essentiels

Performances

Fonctionnels

Publicitaires

Impossible d'enregistrer les préférences concernant les cookies

Transcription d’un fichier audio à l’aide d’un vocabulaire personnalisé médical

AWS Management Console

Pour activer le partitionnement de locuteurs dans un fichier audio à l’aide d’une tâche de transcription par lots (API)

« Hello, World! »

Pour activer le partitionnement de locuteurs dans un fichier audio à l’aide d’une tâche de transcription par lots (API)

Cette page vous a-t-elle été utile ?

Rubrique suivante :

Rubrique précédente :

Avez-vous besoin d’aide ?