Utiliser un filtre de glossaire personnalisé - Amazon Transcribe

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser un filtre de glossaire personnalisé

Une fois votre filtre de vocabulaire personnalisé créé, vous pouvez l'inclure dans vos demandes de transcription. Reportez-vous aux sections suivantes pour obtenir des exemples.

La langue du filtre de vocabulaire personnalisé que vous incluez dans votre demande doit correspondre au code de langue que vous avez spécifié pour votre média. Si vous utilisez l'identification de la langue et que vous spécifiez plusieurs options linguistiques, vous pouvez inclure un filtre de vocabulaire personnalisé par langue spécifiée. Si les langues de vos filtres de vocabulaire personnalisés ne correspondent pas à la langue identifiée dans votre audio, vos filtres ne sont pas appliqués à votre transcription et il n'y a aucun avertissement ni erreur.

Utilisation d'un filtre de vocabulaire personnalisé dans une transcription par lots

Pour utiliser un filtre de vocabulaire personnalisé avec une transcription par lots, consultez les exemples suivants :

  1. Connectez-vous à AWS Management Console.

  2. Dans le volet de navigation, choisissez Tâches de transcription, puis sélectionnez Créer une tâche (en haut à droite). La page Spécifier les détails de la tâche s'ouvre.

    Amazon Transcribecapture d'écran de la console : page « Spécifier les paramètres des tâches ».

    Donnez un nom à votre tâche et spécifiez votre support d'entrée. Incluez éventuellement d'autres champs, puis choisissez Suivant.

  3. Sur la page Configurer la tâche, dans le panneau de suppression de contenu, activez le filtrage du vocabulaire.

    Amazon Transcribecapture d'écran de la console : la page « configurer la tâche ».
  4. Sélectionnez votre filtre de vocabulaire personnalisé dans le menu déroulant et spécifiez la méthode de filtrage.

    Amazon Transcribecapture d'écran de la console : options de sélection du filtre de vocabulaire.
  5. Sélectionnez Créer une tâche pour exécuter votre tâche de transcription.

Cet exemple utilise la start-transcription-jobcommande et leSettings paramètre avec lesVocabularyFilterMethod sous-paramètresVocabularyFilterName et. Pour plus d'informations, consultez StartTranscriptionJob et Settings.

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --settings VocabularyFilterName=my-first-vocabulary-filter,VocabularyFilterMethod=mask

Voici un autre exemple d'utilisation de la start-transcription-jobcommande et d'un corps de requête qui inclut votre filtre de vocabulaire personnalisé associé à cette tâche.

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://my-first-vocabulary-filter-job.json

Le fichier my-first-vocabulary-filter-job.json contient le corps de requête suivant.

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Settings": { "VocabularyFilterName": "my-first-vocabulary-filter", "VocabularyFilterMethod": "mask" } }

Cet exemple utilise leAWS SDK for Python (Boto3) pour inclure un filtre de vocabulaire personnalisé utilisant l'Settingsargument de la méthode start_transcription_job. Pour plus d'informations, consultez StartTranscriptionJob et Settings.

Pour des exemples supplémentaires d'utilisationAWS des SDK, y compris des exemples spécifiques à des fonctionnalités, des scénarios et des exemples interservices, consultez leExemples de code pour Amazon Transcribe à l'aide de AWS SDKs chapitre.

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Settings = { 'VocabularyFilterName': 'my-first-vocabulary-filter', 'VocabularyFilterMethod': 'mask' } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

Utilisation d'un filtre de vocabulaire personnalisé dans une transcription en streaming

Pour utiliser un filtre de vocabulaire personnalisé avec une transcription en continu, consultez les exemples suivants :

  1. Connectez-vous au AWS Management Console.

  2. Dans le panneau de navigation, choisissez Transcription en temps réel. Faites défiler l'écran vers le bas jusqu'à Paramètres de suppression de contenu et agrandissez ce champ s'il est réduit.

    Amazon Transcribecapture d'écran de la console : la page de « transcription en temps réel ».
  3. Activez le filtrage du vocabulaire. Sélectionnez un filtre de glossaire personnalisé dans le menu déroulant et spécifiez la méthode de filtrage.

    Amazon Transcribecapture d'écran de la console : le volet étendu des « paramètres de suppression de contenu ».

    Ajoutez les autres paramètres que vous souhaitez appliquer à votre flux.

  4. Voici le moment pour transcrire votre stream. Sélectionnez Démarrer la diffusion et commencez à parler. Pour mettre fin à votre dictée, sélectionnez Arrêter la diffusion.

Cet exemple crée une requête HTTP/2 qui inclut votre filtre de vocabulaire personnalisé et votre méthode de filtrage. Pour plus d'informations sur l'utilisation du streaming HTTP/2 avecAmazon Transcribe, consultezConfiguration d'un flux HTTP /2. Pour plus de détails sur les paramètres et les en-têtes spécifiques àAmazon Transcribe, consultez StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-language-code: en-US x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-vocabulary-filter-name: my-first-vocabulary-filter x-amzn-transcribe-vocabulary-filter-method: mask transfer-encoding: chunked

Les définitions de paramètres se trouvent dans la référence de l'API ; les paramètres communs à toutes les opérations de l'AWSAPI sont répertoriés dans la section Paramètres communs.

Cet exemple crée une URL présignée qui applique votre filtre de vocabulaire personnalisé à un WebSocket flux. Les sauts de ligne ont été ajoutés pour faciliter la lecture. Pour plus d'informations sur l'utilisation WebSocket des flux avecAmazon Transcribe, consultezConfiguration d'un WebSocket stream. Pour plus de détails sur les paramètres, reportez-vous à la section StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US &media-encoding=flac &sample-rate=16000 &vocabulary-filter-name=my-first-vocabulary-filter &vocabulary-filter-method=mask

Les définitions de paramètres se trouvent dans la référence de l'API ; les paramètres communs à toutes les opérations de l'AWSAPI sont répertoriés dans la section Paramètres communs.