カスタムボキャブラリーフィルターを使用して単語を削除、マスク、またはフラグを付ける - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

カスタムボキャブラリーフィルターを使用して単語を削除、マスク、またはフラグを付ける

カスタムボキャブラリーフィルターは、文字起こし出力で変更したい個々の単語のカスタムリストを含むテキストファイルです。

一般的な使用例としては、攻撃的または冒涜的な用語を削除することがありますが、カスタムボキャブラリーフィルターは完全にカスタム化されているため、好きな単語を選択できます。たとえば、発売予定の新製品がある場合、会議の議事録に製品名を隠すことができます。この場合、 up-to-date 製品名は発売まで秘密にしておきながら、関係者を保護することになります。

語彙フィルタリングにはmask、、remove、の 3 つの表示方法がありますtag。次の例を参照して、それぞれの仕組みを確認してください。

  • マスク:指定された単語を 3 つのアスタリスク (***) に置き換えます

    "transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."
  • 削除:指定した単語を削除し、その場所には何も残しません。

    "transcript": "You can specify a list of or words, and removes them from transcripts automatically."
  • タグ:指定された各単語にタグ ("vocabularyFilterMatch": true) を追加しますが、単語自体は変更しません。タグ付けにより、トランスクリプトの置換や編集を迅速に行うことができます。

    "transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically." ... "alternatives": [ { "confidence": "1.0", "content": "profane" } ], "type": "pronunciation", "vocabularyFilterMatch": true

文字起こしリクエストを送信するときに、カスタムボキャブラリーフィルターと適用するフィルター方法を指定できます。 Amazon Transcribe次に、指定したフィルター方法に従って、文字起こしに完全に一致する単語がトランスクリプトに表示されたときに修正されます。

カスタムボキャブラリーフィルターは、バッチおよびストリーミングの文字起こしリクエストに適用できます。カスタム語彙フィルタを作成する方法については、「」を参照してください語彙フィルターを作成する。カスタムボキャブラリフィルタを適用する方法については、を参照してくださいカスタムボキャブラリーフィルターを使用する

注記

Amazon Transcribe人種差別に敏感な用語は自動的にマスクされますが、AWSテクニカルSupport に連絡してこのデフォルトフィルターをオプトアウトできます。

ボキャブラリーフィルタリングのビデオチュートリアルについては、以下を参照してください。

ボキャブラリーフィルタリングに固有の API 操作