ビデオ字幕の作成 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ビデオ字幕の作成

Amazon TranscribeWebVTT (*.vtt) および SubRip (*.srt) 出力をサポートし、ビデオ字幕として使用できます。バッチビデオ文字起こしジョブを設定するときに、1 つまたは両方のファイルタイプを選択できます。字幕機能を使用すると、選択した文字起こしファイルと通常の文字起こしファイル (追加情報を含む) が生成されます。字幕と文字起こしファイルは、同じ出力先に出力されます。

字幕は、テキストが話されると同時に表示され、自然な一時停止があるか、スピーカーが話しかけるまで表示され続けます。トランスクリプションリクエストで字幕を有効にしていて、音声に音声が含まれていない場合、字幕ファイルは作成されないことに注意してください。

重要

Amazon Transcribe0字幕出力にはデフォルトの開始インデックスを使用します。これは、1広く使用されているの値とは異なります。の開始インデックスが必要な場合は1OutputStartIndexパラメータを使用して API リクエストの AWS Management Console OR でこれを指定できます。

間違った開始インデックスを使用すると、他のサービスとの互換性エラーが発生する可能性があるため、字幕を作成する前に、必要な開始インデックスを確認してください。使用する値がわからない場合は、1選択することをおすすめします。Subtitles詳細については、を参照してください。

字幕でサポートされる機能 :

  • コンテンツの墨消し — 編集されたコンテンツは、字幕と通常の文字起こし出力で反映されます。PII音声は変更されません。

  • ボキャブラリーフィルター:字幕ファイルは文字起こしファイルから生成されるため、標準の文字起こし出力でフィルタリングした単語も字幕でフィルタリングされます。フィルタされたコンテンツは文字起こしと字幕ファイルに空白 または *** として表示されます。音声は変更されません。

  • スピーカー文字起こしセグメントに複数のスピーカーがある場合、ダッシュを使用して各スピーカーを区別します。ダッシュを使用して各スピーカーを区別します。これは WebVTT SubRip と形式の両方に適用されます。次に例を示します。

    • — 人によって話されるテキスト 1

    • — 人によって話されるテキスト 2

字幕ファイルは、Amazon S3文字起こし出力と同じ場所に保存されます。

字幕作成のビデオチュートリアルについては、以下を参照してください。

字幕ファイルの生成

、、または AWSSDK を使用して字幕ファイルを作成できます。次の例を参照してください。AWS Management ConsoleAWS CLI

  1. AWS Management Console にサインインします。

  2. ナビゲーションペインで変換の文字起こしジョブの作成ボタンをクリックして変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換変換を実行します変換 これにより、ジョブの詳細を指定 ページが開きます。字幕オプションは、出力データ パネルにあります。

  3. 字幕ファイルに必要な形式を選択し、スタートインデックスの値を選択します。Amazon Transcribe1デフォルトはですが0、より広く使用されていることに注意してください。どの値を使うべきかわからない場合は、他のサービスとの互換性が向上する可能性があるため1、選択することをおすすめします。

    Amazon Transcribeコンソールのスクリーンショット:「ジョブ詳細の指定」ページの「出力データ」ペイン。
  4. 他に追加したい他のフィールドに入力後、変換を実行します。これにより、ジョブの設定 : オプション ページ へ移動します。

  5. ジョブの作成ボタンをクリックして変換を実行します変換を実行します変換を実行します変換を実行します変換を実行します変換を実行します変換を実行します変換を実行します

この例では、start-transcription-jobSubtitlesコマンドとパラメーターを使用しています。詳細については、StartTranscriptionJobおよびSubtitlesを参照してください。

aws transcribe start-transcription-job \ --region us-west-2 \ --transcription-job-name my-first-transcription-job \ --media MediaFileUri=s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac \ --output-bucket-name DOC-EXAMPLE-BUCKET \ --output-key my-output-files/ \ --language-code en-US \ --subtitles Formats=vtt,srt,OutputStartIndex=1

別の例として、start-transcription-job変換に字幕を追加するリクエストボディを使用します。

aws transcribe start-transcription-job \ --region us-west-2 \ --cli-input-json file://my-first-subtitle-job.json

ファイル my-first-subtitle-job.json に次のリクエストボディを実行します。

{ "TranscriptionJobName": "my-first-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Subtitles": { "Formats": [ "vtt","srt" ], "OutputStartIndex": 1 } }

この例では、transstart_transcription_job メソッドの AWS SDK for Python (Boto3) 引数で、Subtitles を使用して字幕を追加します。詳細については、StartTranscriptionJobおよびSubtitlesを参照してください。

機能固有の例、シナリオ、クロスサービスの例など、AWS SDK を使用するその他の例については、この章を参照してください。を使用した Amazon Transcribe のコード例 AWS SDKs

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-media-file.flac" transcribe.start_transcription_job( TranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Subtitles = { 'Formats': [ 'vtt','srt' ], 'OutputStartIndex': 1 } ) while True: status = transcribe.get_transcription_job(TranscriptionJobName = job_name) if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)