Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Transcription d’un fichier audio à l’aide d’un vocabulaire personnalisé médical
Utilisez le StartMedicalTranscriptionJob
ou AWS Management Console pour démarrer une tâche de transcription qui utilise un vocabulaire personnalisé afin d'améliorer la précision de la transcription.
-
Connectez-vous à la AWS Management Console
. -
Dans le volet de navigation, sous Amazon Transcribe Medical, sélectionnez Transcription jobs.
-
Choisissez Créer une tâche.
-
Sur la page Spécifier les détails de la tâche, fournissez des informations sur votre tâche de transcription.
-
Choisissez Suivant.
-
Sous Personnalisation, activez Vocabulaire personnalisé.
-
Sous Sélection du vocabulaire, choisissez un vocabulaire personnalisé.
-
Sélectionnez Create (Créer).
Pour activer le partitionnement de locuteurs dans un fichier audio à l’aide d’une tâche de transcription par lots (API)
-
Pour l’API
StartMedicalTranscriptionJob
, spécifiez ce qui suit.-
Pour
MedicalTranscriptionJobName
, spécifiez un nom unique dans votre Compte AWS. -
Pour
LanguageCode
, spécifiez le code de langue correspondant à la langue parlée dans votre fichier audio et la langue de votre filtre de vocabulaire. -
Pour le paramètre
MediaFileUri
de l’objetMedia
, spécifiez le nom du fichier audio que vous souhaitez transcrire. -
Pour
Specialty
, spécifiez la spécialité médicale du médecin qui parle dans le fichier audio. -
Pour
Type
, spécifiez si le fichier audio est une conversation ou une dictée. -
Pour
OutputBucketName
, spécifiez le compartiment Amazon S3 dans lequel stocker les résultats de transcription. -
Pour l’objet
Settings
, spécifiez ce qui suit :-
VocabularyName
– Nom de votre vocabulaire personnalisé.
-
-
La requête suivante utilise le AWS SDK pour Python (Boto3) pour démarrer une tâche de transcription par lots avec un vocabulaire personnalisé.
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2
')
job_name = "my-first-med-transcription-job
"
job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-media-file
.flac
"
transcribe.start_medical_transcription_job(
MedicalTranscriptionJobName = job_name,
Media = {
'MediaFileUri': job_uri
},
OutputBucketName = 'amzn-s3-demo-bucket
',
OutputKey = 'my-output-files
/',
LanguageCode = 'en-US',
Specialty = 'PRIMARYCARE',
Type = 'CONVERSATION',
Settings = {
'VocabularyName': 'example-med-custom-vocab'
}
)
while True:
status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
break
print("Not ready yet...")
time.sleep(5)
print(status)