カスタムボキャブラリーフィルターを使用して単語を削除、マスク、またはフラグを付ける

カスタムボキャブラリーフィルターは、文字起こし出力で変更したい個々の単語のカスタムリストを含むテキストファイルです。

一般的な使用例としては、攻撃的または冒涜的な用語を削除することがありますが、カスタムボキャブラリーフィルターは完全にカスタム化されているため、好きな単語を選択できます。たとえば、発売予定の新製品がある場合、会議の議事録に製品名を隠すことができます。この場合、 up-to-date 製品名は発売まで秘密にしておきながら、関係者を保護することになります。

語彙フィルタリングにはmask、、remove、の 3 つの表示方法がありますtag。次の例を参照して、それぞれの仕組みを確認してください。

マスク:指定された単語を 3 つのアスタリスク (***) に置き換えます


"transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."

削除:指定した単語を削除し、その場所には何も残しません。


"transcript": "You can specify a list of or words, and removes them from transcripts automatically."

タグ:指定された各単語にタグ ("vocabularyFilterMatch": true) を追加しますが、単語自体は変更しません。タグ付けにより、トランスクリプトの置換や編集を迅速に行うことができます。


"transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically."
...
    "alternatives": [
        {
            "confidence": "1.0",
            "content": "profane"
        }
    ],
    "type": "pronunciation",
    "vocabularyFilterMatch": true

文字起こしリクエストを送信するときに、カスタムボキャブラリーフィルターと適用するフィルター方法を指定できます。 Amazon Transcribe次に、指定したフィルター方法に従って、文字起こしに完全に一致する単語がトランスクリプトに表示されたときに修正されます。

カスタムボキャブラリーフィルターは、バッチおよびストリーミングの文字起こしリクエストに適用できます。カスタム語彙フィルタを作成する方法については、「」を参照してください語彙フィルターを作成する。カスタムボキャブラリフィルタを適用する方法については、を参照してくださいカスタム語彙フィルターの使用。

注記

Amazon Transcribe人種差別に敏感な用語は自動的にマスクされますが、AWSテクニカルSupport に連絡してこのデフォルトフィルターをオプトアウトできます。

ボキャブラリーフィルタリングのビデオチュートリアルについては、以下を参照してください。

ボキャブラリーフィルタリングに固有の API 操作

CreateVocabularyFilter, DeleteVocabularyFilter, GetVocabularyFilter, ListVocabularyFilters, UpdateVocabularyFilter

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

カスタム言語モデルの使用

語彙フィルターを作成する