Utilisation d'un fichier texte pour créer un vocabulaire médical personnalisé

Pour créer un vocabulaire personnalisé, vous devez avoir préparé un fichier texte contenant une collection de mots ou de phrases. Amazon Transcribe Medical utilise ce fichier texte pour créer un vocabulaire personnalisé que vous pouvez utiliser pour améliorer la précision de transcription de ces termes ou expressions. Vous pouvez créer un vocabulaire personnalisé à l'aide de l'CreateMedicalVocabularyAPI ou de la consoleAmazon Transcribe médicale.

Pour utiliser leAWS Management Console afin de créer un vocabulaire personnalisé, vous devez fournir l'Amazon S3URI du fichier texte contenant vos mots ou phrases.

Connectez-vous à AWS Management Console.
Dans le panneau de navigation, sousAmazon Transcribe Médical, sélectionnez vocabulaire personnalisé de vocabulaire personnalisé.
Dans le champ Nom, sous Paramètres du vocabulaire, choisissez un nom pour votre vocabulaire personnalisé.
Spécifiez l'emplacement de votre fichier audio ou vidéo dans Amazon S3 :
- Pour l'emplacement du fichier d'entrée de vocabulaire sur S3, sous Paramètres de vocabulaire, spécifiez l'Amazon S3URI qui identifie le fichier texte que vous utiliserez pour créer votre vocabulaire personnalisé.
- Pour l'emplacement du fichier d'entrée de vocabulaire dans S3, choisissez Browse S3 pour rechercher le fichier texte et le sélectionner.
Choisissez Créer du vocabulaire.

Vous pouvez consulter l'état de traitement de votre vocabulaire personnalisé dans leAWS Management Console.

Pour créer un vocabulaire médical personnalisé (API)

Pour l'StartTranscriptionJobAPI, spécifiez ce qui suit.
1. Pour LanguageCode, spécifiez en-US.
2. PourVocabularyFileUri, spécifiez l'Amazon S3emplacement du fichier texte que vous utilisez pour définir votre vocabulaire personnalisé.
3. PourVocabularyName, spécifiez un nom pour votre vocabulaire personnalisé. Le nom que vous spécifiez doit être unique au sein de votre nomCompte AWS.

Pour voir l'état de traitement de votre vocabulaire personnalisé, utilisez l'GetMedicalVocabularyAPI.

Voici un exemple de demande utilisant le vocabulaire personnaliséAWS SDK for Python (Boto3) de vocabulaire personnalisé.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Pour activer le partitionnement des haut-parleurs dans une tâche de transcription par lots (AWS CLI)

Exécutez le code suivant.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Création d'un fichier texte pour votre vocabulaire médical personnalisé

Transcription d'un fichier audio à l'aide d'un vocabulaire médical personnalisé