사용자 지정 어휘 필터를 사용하여 단어를 삭제, 마스킹 또는 플래그 지정 - Amazon Transcribe

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용자 지정 어휘 필터를 사용하여 단어를 삭제, 마스킹 또는 플래그 지정

사용자 지정 어휘 필터는 트랜스크립션 출력물에서 수정하려는 개별 단어의 사용자 지정 목록이 포함된 텍스트 파일입니다.

일반적인 사용 사례는 모욕적이거나 욕설적인 용어를 제거하는 것입니다. 그러나 사용자 지정 어휘 필터는 완전히 사용자 지정되므로 원하는 단어를 선택할 수 있습니다. 예를 들어 출시를 앞둔 신제품이 있는 경우 회의 녹취록에서 제품 이름을 숨길 수 있습니다. 이 경우 출시 전까지 제품 이름을 비밀로 up-to-date 유지하면서 이해관계자를 보호해야 합니다.

어휘 필터링에는maskremove, 및 세 가지 표시 방법이tag 있습니다. 각각의 작동 방식을 보려면 다음 예를 참조하십시오.

  • 마스크: 지정한 단어를 세 개의 별표 (***) 로 바꿉니다.

    "transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."
  • 제거: 지정된 단어를 삭제하고 그 자리에 아무 것도 남기지 않습니다.

    "transcript": "You can specify a list of or words, and removes them from transcripts automatically."
  • 태그: 지정된 각 단어에 태그 ("vocabularyFilterMatch": true) 를 추가하지만 단어 자체는 변경하지 않습니다. 태깅을 통해 빠르게 트랜스크립트를 대체하고 편집할 수 있습니다.

    "transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically." ... "alternatives": [ { "confidence": "1.0", "content": "profane" } ], "type": "pronunciation", "vocabularyFilterMatch": true

트랜스크립션 요청을 제출할 때 적용할 사용자 지정 어휘 필터와 필터링 방법을 지정할 수 있습니다. Amazon Transcribe그런 다음 지정한 필터링 방법에 따라 트랜스크립트에 나타나는 정확한 단어 일치 항목을 수정합니다.

사용자 지정 어휘 필터를 일괄 처리 및 스트리밍 트랜스크립션 요청에 적용할 수 있습니다. 사용자 지정 어휘 필터를 생성하는 방법은 단원을 참조하십시오어휘 필터 만들기. 사용자 지정 어휘 필터를 적용하는 방법을 알아보려면 을 참조하십시오사용자 지정 단어 필터 사용.

참고

Amazon Transcribe인종적으로 민감한 용어는 자동으로 마스킹되지만 AWS기술 Support 문의하여 이 기본 필터를 사용하지 않도록 설정할 수 있습니다.

어휘 필터링에 대한 비디오 설명을 보려면 다음을 참조하십시오.