カスタム語彙をカスタム言語モデルによる文字起こしの精度の向上 - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタム語彙をカスタム言語モデルによる文字起こしの精度の向上

メディアにブランド名、略語、専門用語、専門用語、専門用語など、ドメイン固有または非標準の用語が含まれていると、Amazon Transcribeそれらの用語が文字起こし出力に正しく取り込まれない可能性があります。

文字起こしの誤りを修正し、特定のユースケースに合わせて出力をカスタマイズするには、カスタム語彙とを作成しますカスタム言語モデル

  • カスタム語彙あらゆる文脈で特定の単語の認識とフォーマットの両方を調整し、強化するように設計されています。これには、単語と、Amazon Transcribeオプションで発音と表示形式を入力することが含まれます。

    トランスクリプトで特定の用語が正しく表示されない場合はAmazon Transcribe、Amazon Transcribeこれらの用語の表示方法を示すカスタムボキャブラリファイルを作成できます。この単語固有のアプローチは、ブランド名や頭字語などの用語の修正に最も適しています。

  • カスタム言語モデル用語に関連する文脈を捉えるように設計されています。これには、Amazon Transcribeドメイン固有のテキストデータを大量に提供することが含まれます。

    専門用語が正しく表示されていない場合や、トランスクリプトに間違った同音異義語を使用している場合はAmazon Transcribe、Amazon Transcribeドメイン固有の言語を教えるカスタム言語モデルを作成できます。たとえば、カスタム言語モデルでは、「フロー」(アイスフロー) と「フロー」(リニアフロー) のどちらを使用するかを学習できます。

    このコンテキスト認識アプローチは、ドメイン固有の音声を大量に文字起こしする場合に最も適しています。カスタム語彙を単独で達成するよりも精度が大幅に向上する可能性があります。バッチトランスクリプションを使用する場合、リクエストにカスタム言語モデルとカスタムボキャブラリーの両方を含めることができます。

ヒント

最高の文字起こしの精度を達成するには、カスタム語彙をカスタム言語モデルと組み合わせて使用します。

カスタムボキャブラリーの作成と使用のビデオチュートリアルについては、以下を参照してください。

カスタム言語モデルの作成と使用のビデオチュートリアルについては、以下を参照してください。