기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 어휘 필터를 사용하여 단어 삭제, 마스킹 또는 플래그 지정
사용자 지정 어휘 필터는 트랜스크립션 출력에서 수정할 개별 단어의 사용자 지정 목록이 포함된 텍스트 파일입니다.
일반적인 사용 사례는 모욕적이거나 비속한 용어를 제거하는 것이지만, 사용자 지정 어휘 필터는 전적으로 사용자가 지정하므로 원하는 단어를 선택할 수 있습니다. 예를 들어 새 제품이 곧 출시될 경우 회의 트랜스크립트에서 제품 이름을 숨길 수 있습니다. 이 경우 출시 전까지 제품 이름을 비밀로 유지하면서 이해 관계자에게 최신 정보를 알릴 수 있습니다.
어휘 필터링에는mask
, remove
, tag
의 세 가지 표시 방법이 있습니다. 각 예시의 작동 방식을 보려면 다음 예를 참조하세요.
-
마스킹: 지정된 단어를 별표 3개(***) 로 바꿉니다.
"transcript": "You can specify a list of *** or *** words, and *** *** removes them from transcripts automatically."
-
제거: 지정된 단어를 삭제하고 그 위치에 아무것도 남기지 않습니다.
"transcript": "You can specify a list of or words, and removes them from transcripts automatically."
-
태그: 지정된 각 단어에 태그(
"vocabularyFilterMatch": true
)를 추가하지만 단어 자체는 변경하지 않습니다. 태그를 지정하면 트랜스크립트를 빠르게 대체하고 편집할 수 있습니다."transcript": "You can specify a list of profane or offensive words, and amazon transcribe removes them from transcripts automatically."
...
"alternatives": [ { "confidence": "1.0", "content": "profane" } ], "type": "pronunciation", "vocabularyFilterMatch": true
트랜스크립션 요청을 제출할 때 사용자 지정 어휘 필터와 적용할 필터링 방법을 지정할 수 있습니다. Amazon Transcribe 그러면는 지정한 필터링 방법에 따라 트랜스크립트에 정확한 단어 일치가 표시될 때 정확한 단어 일치를 수정합니다.
사용자 지정 어휘 필터는 배치 및 스트리밍 트랜스크립션 요청에 적용할 수 있습니다. 사용자 지정 어휘 필터를 생성하는 방법을 알아보려면 어휘 필터 생성 섹션을 참조하세요. 사용자 지정 어휘 필터를 적용하는 방법을 알아보려면 사용자 지정 어휘 필터 사용 섹션을 참조하세요.
참고
Amazon Transcribe 는 인종적으로 민감한 용어를 자동으로 마스킹하지만 AWS 기술 지원
어휘 필터링에 대한 비디오 시연은 다음을 참조하세요.