Usando filtros de vocabulário personalizados para excluir, mascarar ou sinalizar palavras

Um filtro de vocabulário personalizado é um arquivo de texto que contém uma lista personalizada de palavras individuais que você deseja modificar na saída da transcrição.

Um caso de uso comum é a remoção de termos ofensivos ou profanos; no entanto, os filtros de vocabulário personalizados são totalmente personalizados, para que você possa selecionar as palavras que quiser. Por exemplo, se você tiver um novo produto prestes a ser lançado, poderá mascarar o nome do produto nas transcrições da reunião. Nesse caso, você mantém as partes interessadas up-to-date enquanto mantém o nome do produto em segredo até o lançamento.

A filtragem de vocabulário tem três métodos de exibição:maskremove,tag e. Consulte os exemplos a seguir para ver como cada um funciona.

Máscara: substitui palavras especificadas por três asteriscos (***).


"transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."

Remover: exclui palavras especificadas, não deixando nada em seu lugar.


"transcript": "You can specify a list of or words, and removes them from transcripts automatically."

Tag: adiciona uma tag ("vocabularyFilterMatch": true) a cada palavra especificada, mas não altera a palavra em si. A marcação permite substituições e edições rápidas de transcrições.


"transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically."
...
    "alternatives": [
        {
            "confidence": "1.0",
            "content": "profane"
        }
    ],
    "type": "pronunciation",
    "vocabularyFilterMatch": true

Ao enviar uma solicitação de transcrição, você pode especificar um filtro de vocabulário personalizado e o método de filtragem que deseja aplicar. Amazon Transcribeem seguida, modifica as correspondências exatas de palavras quando elas aparecem na sua transcrição, de acordo com o método de filtragem que você especificar.

Filtros de vocabulário personalizados podem ser aplicados a solicitações de transcrição em lote e streaming. Para saber como criar um filtro de banco de dados personalizado, consulteCriação de um filtro de vocabulário. Para saber como aplicar seu filtro de vocabulário personalizado, consulteUsando um filtro de vocabulário personalizado.

nota

Amazon Transcribemascara automaticamente termos racialmente sensíveis, embora você possa desativar esse filtro padrão entrando em contato com o SupportAWS Técnico.

Para ver um vídeo passo a passo sobre a filtragem de vocabulário, consulte:

Operações de API específicas para filtragem de vocabulário

CreateVocabularyFilter, DeleteVocabularyFilter, GetVocabularyFilter, ListVocabularyFilters, UpdateVocabularyFilter

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Usando um modelo de linguagem personalizado

Criação de um filtro de vocabulário