代替文字起こし - Amazon Transcribe

代替文字起こし

は、音声を Amazon Transcribe 書き起こすときに、同じトランスクリプトの異なるバージョンを作成し、各バージョンに信頼スコアを割り当てます。一般的な文字起こしでは、信頼スコアが最も高いバージョンしか得られません。

代替文字起こしを有効にすると、は信頼レベルが低い他のバージョンの文字起こし Amazon Transcribe を返します。最大 10 個の代替文字起こしを返すように選択できます。が Amazon Transcribe 識別する数よりも多くの代替手段を指定すると、実際の代替手段の数のみが返されます。

代替案はすべて同じ文字起こし出力ファイルにあり、セグメントレベルで表示されます。セグメントは、スピーカーの変更や音声の一時停止など、音声の自然な間のことです。

代替文字起こしは、バッチ文字起こしでのみ使用できます。

文字起こし出力は次のように構成されています。コード例の省略記号 (...) は、簡潔にするためにコンテンツが削除された場所を示しています。

指定されたセグメントの完全な最終文字起こし。


"results": {
    "language_code": "en-US",
    "transcripts": [
        {
            "transcript": "The amazon is the largest rainforest on the planet."
        }
    ],

前の transcript セクションの各単語の信頼スコア。


"items": [
    {
        "start_time": "1.15",
        "end_time": "1.35",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "The"
            }
        ],
        "type": "pronunciation"
    },
    {
        "start_time": "1.35",
        "end_time": "2.05",
        "alternatives": [
            {
                "confidence": "1.0",
                "content": "amazon"
            }
        ],
        "type": "pronunciation"
    },

代替の文字起こしは、文字起こし出力の segments 部分にあります。各セグメントの代替案は、信頼スコアの降順で並べられています。


"segments": [
            {
                "start_time": "1.04",
                "end_time": "5.065",
                "alternatives": [
                    {    
                ...
                        "transcript": "The amazon is the largest rain forest on the planet.",
                        "items": [
                            {
                             "start_time": "1.15",
                                "confidence": "1.0",
                                "end_time": "1.35",
                                "type": "pronunciation",
                                "content": "The"
                            },
                            ...
                            {
                                "start_time": "3.06",
                                "confidence": "0.0037",
                                "end_time": "3.38",
                                "type": "pronunciation",
                                "content": "rain"
                            },
                            {
                                "start_time": "3.38",
                                "confidence": "0.0037",
                                "end_time": "3.96",
                                "type": "pronunciation",
                                "content": "forest"
                            },

文字起こし出力の最後にあるステータス。
```
"status": "COMPLETED"
}
```

代替文字起こしのリクエスト

AWS Management Console、AWS CLI、または AWS SDK を使用して代替文字起こしをリクエストできます。例については、以下を参照してください。

AWS Management Consoleにサインインします。
ナビゲーションペインで、[文字起こしジョブ] を選択後、[ジョブの作成] (右上) を選択します。これにより、「ジョブの詳細を指定」ページが開きます。
ジョブの詳細を指定ページで追加したいフィールドに入力後、「次へ」を選択します。これにより、ジョブの設定 - オプションページへ移動します。

「代替結果」を選択し、トランスクリプトに必要な代替文字起こし結果の最大数を指定します。
[ジョブの作成] を選択して、文字起こしジョブを実行します。

AWS Management Console

AWS Management Consoleにサインインします。
ナビゲーションペインで、[文字起こしジョブ] を選択後、[ジョブの作成] (右上) を選択します。これにより、「ジョブの詳細を指定」ページが開きます。
ジョブの詳細を指定ページで追加したいフィールドに入力後、「次へ」を選択します。これにより、ジョブの設定 - オプションページへ移動します。

「代替結果」を選択し、トランスクリプトに必要な代替文字起こし結果の最大数を指定します。
[ジョブの作成] を選択して、文字起こしジョブを実行します。

この例では、start-transcription-job コマンドと ShowAlternatives パラメータを使用します。詳細については、StartTranscriptionJobおよびShowAlternativesを参照してください。

ShowAlternatives=true をリクエストに含める場合は、MaxAlternatives も含める必要があることに注意してください。


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

別の例として、start-transcription-job コマンド、および代替文字起こしを含むリクエストボディを使用します。


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

ファイル my-first-transcription-job.json には、次のリクエストボディが含まれています。


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

AWS CLI

ShowAlternatives=true をリクエストに含める場合は、MaxAlternatives も含める必要があることに注意してください。


aws transcribe start-transcription-job \
--region us-west-2 \
--transcription-job-name my-first-transcription-job \
--media MediaFileUri=s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac \
--output-bucket-name amzn-s3-demo-bucket \
--output-key my-output-files/ \
--language-code en-US \
--settings ShowAlternatives=true,MaxAlternatives=4

別の例として、start-transcription-job コマンド、および代替文字起こしを含むリクエストボディを使用します。


aws transcribe start-transcription-job \
--region us-west-2 \
--cli-input-json file://filepath/my-first-alt-transcription-job.json

ファイル my-first-transcription-job.json には、次のリクエストボディが含まれています。


{
  "TranscriptionJobName": "my-first-transcription-job",  
  "Media": {
        "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
   },
  "OutputBucketName": "amzn-s3-demo-bucket",
  "OutputKey": "my-output-files/", 
  "LanguageCode": "en-US",
  "Settings": {
        "ShowAlternatives": true,
        "MaxAlternatives": 4
   }
}

次の例では、を使用して AWS SDK for Python (Boto3) 、start_transcription_job メソッドの ShowAlternatives引数を使用して代替文字起こしをリクエストします。詳細については、StartTranscriptionJobおよびShowAlternativesを参照してください。

機能固有の例、シナリオ例、クロスサービス例など、 AWS SDKsSDK を使用した Amazon Transcribe のコード例 AWS SDKs「」章を参照してください。

'ShowAlternatives':True をリクエストに含める場合は、MaxAlternatives も含める必要があることに注意してください。


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

AWS SDK for Python (Boto3)

機能固有の例、シナリオ例、クロスサービス例など、 AWS SDKsSDK を使用した Amazon Transcribe のコード例 AWS SDKs「」章を参照してください。

'ShowAlternatives':True をリクエストに含める場合は、MaxAlternatives も含める必要があることに注意してください。


from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-media-file.flac"
transcribe.start_transcription_job(
    TranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US', 
    Settings = {
        'ShowAlternatives':True, 
        'MaxAlternatives':4
    }
)

while True:
    status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
    if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

ストリーミング言語識別

文字起こし精度の向上

Cookie の設定を選択する

Cookie の設定をカスタマイズする

Essential

Performance

Functional

Advertising

Cookie の設定を保存できません

代替文字起こし

代替文字起こしのリクエスト

AWS Management Console

AWS CLI

AWS SDK for Python (Boto3)

このページは役に立ちましたか?

次のトピック

前のトピック:

ヘルプが必要ですか?

Amazon Transcribe コンソールの「ジョブの詳細を指定」ページ。「ジョブ設定」パネルでは、文字起こしジョブの名前を指定し、モデルタイプを選択し、言語設定を指定できます。

Amazon Transcribe コンソールの「ジョブの設定」ページ。「音声設定」パネルでは、「代替結果」を有効にして、文字起こし出力に含める代替案の最大数を指定できます。