Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
sous-titrage
Amazon Transcribeprend en charge les sorties WebVTT (*.vtt) et SubRip (*.srt) à utiliser comme sous-titres vidéo. Vous pouvez sélectionner un ou les deux types de fichiers lors de la configuration de votre tâche de transcription vidéo par lots. Lorsque vous utilisez la fonction de sous-titres, les fichiers de sous-titres que vous avez sélectionnés et un fichier de transcription normal (contenant des informations supplémentaires) sont produits. Les fichiers de sous-titres et de transcription sont envoyés vers la même destination.
Les sous-titres s'affichent en même temps que le texte est prononcé et restent visibles jusqu'à ce qu'il y ait une pause naturelle ou que l'orateur finisse de parler. Notez que si vous activez les sous-titres dans votre demande de transcription et que votre fichier audio ne contient aucune parole, aucun fichier de sous-titres n'est créé.
Important
Amazon Transcribeutilise un index de départ par défaut de 0
pour la sortie des sous-titres, qui diffère de la valeur la plus couramment utilisée de1
. Si vous avez besoin d'un index de départ de1
, vous pouvez le spécifier dans le AWS Management Console ou dans votre demande d'API à l'aide du OutputStartIndex
paramètre.
L'utilisation d'un index de départ incorrect peut entraîner des erreurs de compatibilité avec d'autres services. Assurez-vous donc de vérifier l'index de départ dont vous avez besoin avant de créer vos sous-titres. Si vous ne savez pas quelle valeur utiliser, nous vous recommandons de choisir1
. Reportez-vous à Subtitles
pour plus d'informations.
Fonctionnalités prises en charge avec les sous-titres :
-
Rédaction du contenu : tout contenu expurgé est reflété sous la forme «
PII
» à la fois dans vos fichiers de sortie de sous-titres et de transcription standard. Le son n'est pas modifié. -
Filtres de vocabulaire : les fichiers de sous-titres sont générés à partir du fichier de transcription, de sorte que tous les mots que vous filtrez dans votre sortie de transcription standard sont également filtrés dans vos sous-titres. Le contenu filtré s'affiche sous forme d'espaces blancs ou
***
dans vos fichiers de transcription et de sous-titres. Le son n'est pas modifié. -
Diarisation du locuteur : s'il y a plusieurs locuteurs dans un segment de sous-titre donné, des tirets sont utilisés pour distinguer chaque locuteur. Cela s'applique à la fois au WebVTT et aux SubRip formats ; par exemple :
-- Texte prononcé par la personne 1
-- Texte prononcé par la personne 2
Les fichiers de sous-titres sont stockés au même Amazon S3 emplacement que la sortie de votre transcription.
Pour une présentation vidéo de la création de sous-titres, voir :
Génération de fichiers de sous-titres
Vous pouvez créer des fichiers de sous-titres à l'aide des AWSkits SDK AWS Management ConsoleAWS CLI,, ou ; consultez les exemples suivants :
-
Connectez-vous à AWS Management Console
. -
Dans le volet de navigation, choisissez Tâches de transcription, puis sélectionnez Créer une tâche (en haut à droite). Cela ouvre la page Spécifier les détails de la tâche. Les options de sous-titres se trouvent dans le panneau Données de sortie.
-
Sélectionnez les formats souhaités pour vos fichiers de sous-titres, puis choisissez une valeur pour votre index de départ. Notez que la Amazon Transcribe valeur par défaut est
0
, mais1
qu'elle est plus largement utilisée. Si vous ne savez pas quelle valeur utiliser, nous vous recommandons de choisir1
, car cela peut améliorer la compatibilité avec d'autres services. -
Renseignez tous les autres champs que vous souhaitez inclure sur la page Spécifier les détails de la tâche, puis sélectionnez Suivant. Cela vous amène à la page Configurer la tâche - optionnelle.
-
Sélectionnez Créer une tâche pour exécuter votre tâche de transcription.
Cet exemple utilise la start-transcription-jobSubtitles
paramètre. Pour plus d'informations, consultez StartTranscriptionJob
et Subtitles
.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameDOC-EXAMPLE-BUCKET
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --subtitles Formats=vtt
,srt
,OutputStartIndex=1
Voici un autre exemple utilisant la start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-subtitle-job
.json
Le fichier my-first-subtitle-job.json contient le corps de requête suivant.
{ "TranscriptionJobName": "
my-first-transcription-job
", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US
", "Subtitles": { "Formats": [ "vtt
","srt
" ], "OutputStartIndex":1
} }
Cet exemple utilise le AWS SDK for Python (Boto3) pour ajouter des sous-titres à l'aide de l'Subtitles
argument de la méthode start_transcription_jobStartTranscriptionJob
et Subtitles
.
Pour des exemples supplémentaires utilisant les AWS kits SDK, notamment des exemples spécifiques aux fonctionnalités, des scénarios et des exemples interservices, consultez le chapitre. Exemples de code pour Amazon Transcribe à l'aide de AWS SDKs
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') job_name = "my-first-transcription-job
" job_uri = "s3://DOC-EXAMPLE-BUCKET
/my-input-files
/my-media-file
.flac
" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US
', Subtitles = { 'Formats': [ 'vtt
','srt
' ], 'OutputStartIndex':1
} ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)