Utilisation d'un fichier texte pour créer un vocabulaire médical personnalisé - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utilisation d'un fichier texte pour créer un vocabulaire médical personnalisé

Pour créer un vocabulaire personnalisé, vous devez avoir préparé un fichier texte contenant une collection de mots ou de phrases. Amazon Transcribe Medical utilise ce fichier texte pour créer un vocabulaire personnalisé que vous pouvez utiliser pour améliorer la précision de transcription de ces termes ou expressions. Vous pouvez créer un vocabulaire personnalisé à l'aide de l'CreateMedicalVocabularyAPI ou de la consoleAmazon Transcribe médicale.

Pour utiliser leAWS Management Console afin de créer un vocabulaire personnalisé, vous devez fournir l'Amazon S3URI du fichier texte contenant vos mots ou phrases.

  1. Connectez-vous à AWS Management Console.

  2. Dans le panneau de navigation, sousAmazon Transcribe Médical, sélectionnez vocabulaire personnalisé de vocabulaire personnalisé.

  3. Dans le champ Nom, sous Paramètres du vocabulaire, choisissez un nom pour votre vocabulaire personnalisé.

  4. Spécifiez l'emplacement de votre fichier audio ou vidéo dans Amazon S3 :

    • Pour l'emplacement du fichier d'entrée de vocabulaire sur S3, sous Paramètres de vocabulaire, spécifiez l'Amazon S3URI qui identifie le fichier texte que vous utiliserez pour créer votre vocabulaire personnalisé.

    • Pour l'emplacement du fichier d'entrée de vocabulaire dans S3, choisissez Browse S3 pour rechercher le fichier texte et le sélectionner.

  5. Choisissez Créer du vocabulaire.

Vous pouvez consulter l'état de traitement de votre vocabulaire personnalisé dans leAWS Management Console.

Pour créer un vocabulaire médical personnalisé (API)
  • Pour l'StartTranscriptionJobAPI, spécifiez ce qui suit.

    1. Pour LanguageCode, spécifiez en-US.

    2. PourVocabularyFileUri, spécifiez l'Amazon S3emplacement du fichier texte que vous utilisez pour définir votre vocabulaire personnalisé.

    3. PourVocabularyName, spécifiez un nom pour votre vocabulaire personnalisé. Le nom que vous spécifiez doit être unique au sein de votre nomCompte AWS.

Pour voir l'état de traitement de votre vocabulaire personnalisé, utilisez l'GetMedicalVocabularyAPI.

Voici un exemple de demande utilisant le vocabulaire personnaliséAWS SDK for Python (Boto3) de vocabulaire personnalisé.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_medical_vocabulary( VocabularyName = job_name, VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt' LanguageCode = 'en-US', ) while True: status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Pour activer le partitionnement des haut-parleurs dans une tâche de transcription par lots (AWS CLI)
  • Exécutez le code suivant.

    aws transcribe create-medical-vocabulary \ --vocabulary-name my-first-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \ --language-code en-US