기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
어휘 필터 만들기
사용자 지정 어휘 필터를 만들기 위한 두 가지 옵션이 있습니다.
-
줄로 구분된 단어 목록을 UTF-8 인코딩을 사용하여 일반 텍스트 파일로 저장합니다.
이 접근 방식은AWS Management ConsoleAWS CLI, 또는AWS SDK와 함께 사용할 수 있습니다.
를AWS Management Console 사용하는 경우 사용자 지정 어휘 파일의 로컬 경로 또는Amazon S3 URI를 제공할 수 있습니다.
AWS CLI또는AWS SDK를 사용하는 경우 사용자 지정 어휘 파일을Amazon S3 버킷에 업로드하고 요청에Amazon S3 URI를 포함해야 합니다.
-
쉼표로 구분된 단어 목록을 API 요청에 직접 포함하세요.
-
Words
파라미터를 사용하는AWS CLI 또는AWS SDK와 함께 이 접근 방식을 사용할 수 있습니다.
-
각 방법의 예는 을 참조하십시오.사용자 지정 어휘 필터 만들기
사용자 지정 어휘 필터를 만들 때 참고할 사항:
-
단어는 대/소문자를 구분하지 않습니다. 예를 들어, “저주”와 “CURSE”는 동일하게 취급됩니다.
-
정확히 일치하는 단어만 필터링됩니다. 예를 들어 필터에는 '욕설'이 포함되어 있지만 미디어에 '욕설' 또는 '욕설'이라는 단어가 포함된 경우 이러한 단어는 필터링되지 않습니다. “욕설” 인스턴스만 필터링됩니다. 따라서 필터링하려는 단어의 모든 변형을 포함해야 합니다.
-
필터는 다른 단어에 포함된 단어에는 적용되지 않습니다. 예를 들어 사용자 지정 어휘 필터에 “해양”은 포함되지만 “잠수함”은 포함되어 있지 않은 경우 스크립트에서 “잠수함”은 변경되지 않습니다.
-
각 항목은 한 단어만 포함할 수 있습니다 (공백 없음).
-
사용자 지정 어휘 필터를 텍스트 파일로 저장하는 경우 UTF-8 인코딩이 적용된 일반 텍스트 형식이어야 합니다.
-
사용자 지정 어휘 필터는 한 개당 최대 100개까지 사용할 수AWS 계정 있으며 각 필터의 크기는 최대 50Kb입니다.
-
해당 언어에 지원되는 문자만 사용할 수 있습니다. 자세한 내용은 해당 언어의 문자 세트를 참조하십시오.
사용자 지정 어휘 필터 만들기
에서 사용할 사용자 지정 어휘 필터를 처리하려면 다음 예를 참조하십시오.Amazon Transcribe
계속하기 전에 사용자 지정 어휘 필터를 텍스트 (*.txt) 파일로 저장하세요. 선택적으로 파일을Amazon S3 버킷에 업로드할 수 있습니다.
-
AWS Management Console
에 로그인합니다. -
탐색 창에서 어휘 필터링을 선택합니다. 그러면 기존 사용자 지정 어휘 필터를 보거나 새 사용자 지정 어휘 필터를 만들 수 있는 어휘 필터 페이지가 열립니다.
-
어휘 필터 만들기를 선택합니다.
그러면 어휘 필터 만들기 페이지로 이동합니다. 새 사용자 지정 어휘 필터의 이름을 입력합니다.
어휘 입력 소스에서 파일 업로드 또는 S3 위치 옵션을 선택합니다. 그런 다음 사용자 지정 어휘 파일의 위치를 지정합니다.
-
원하는 경우 사용자 지정 어휘 필터에 태그를 추가할 수 있습니다. 모든 필드를 작성했으면 페이지 하단에서 어휘 필터 만들기를 선택합니다. 파일을 처리하는 중 오류가 없으면 어휘 필터 페이지로 돌아갑니다.
이제 사용자 지정 어휘 필터를 사용할 준비를 마쳤습니다.
이 예제에서는 create-vocabulary-filter명령을 사용하여 단어 목록을 사용 가능한 사용자 지정 어휘 필터로 처리합니다. 자세한 정보는 CreateVocabularyFilter
을 참조하세요.
옵션 1:words
파라미터를 사용하여 요청에 단어 목록을 포함할 수 있습니다.
aws transcribe create-vocabulary-filter \ --vocabulary-filter-name
my-first-vocabulary-filter
\ --language-codeen-US
\ --wordsprofane,offensive,Amazon,Transcribe
옵션 2: 단어 목록을 텍스트 파일로 저장하고Amazon S3 버킷에 업로드한 다음vocabulary-filter-file-uri
파라미터를 사용하여 요청에 파일의 URI를 포함할 수 있습니다.
aws transcribe create-vocabulary-filter \ --vocabulary-filter-name
my-first-vocabulary-filter
\ --language-codeen-US
\ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET
/my-vocabulary-filters
/my-vocabulary-filter
.txt
다음은 create-vocabulary-filter명령을 사용하는 또 다른 예와 사용자 지정 어휘 필터를 생성하는 요청 본문입니다.
aws transcribe create-vocabulary-filter \ --cli-input-json file://
filepath
/my-first-vocab-filter
.json
my-first-vocab-filter.json 파일에는 다음 요청 본문이 포함되어 있습니다.
옵션 1:Words
파라미터를 사용하여 요청에 단어 목록을 포함할 수 있습니다.
{ "VocabularyFilterName": "
my-first-vocabulary-filter
", "LanguageCode": "en-US
", "Words": [ "profane
","offensive
","Amazon
","Transcribe
" ] }
옵션 2: 단어 목록을 텍스트 파일로 저장하고Amazon S3 버킷에 업로드한 다음VocabularyFilterFileUri
파라미터를 사용하여 요청에 파일의 URI를 포함할 수 있습니다.
{ "VocabularyFilterName": "
my-first-vocabulary-filter
", "LanguageCode": "en-US
", "VocabularyFilterFileUri": "s3://DOC-EXAMPLE-BUCKET
/my-vocabulary-filters
/my-vocabulary-filter
.txt" }
참고
요청에 포함하는VocabularyFilterFileUri
경우 사용할Words
수 없으며 둘 중 하나를 선택해야 합니다.
이 예제에서는AWS SDK for Python (Boto3) 를 사용하여 create_vocabulary ary_filter 메서드를 사용하여 사용자 지정 어휘CreateVocabularyFilter
을 참조하세요.
기능별, 시나리오 및 서비스 간 예제를 포함하여AWS SDK를 사용하는 추가 예제는 이Amazon Transcribe를 사용하는 코드 예제 AWS SDKs 장을 참조하십시오.
옵션 1:Words
파라미터를 사용하여 요청에 단어 목록을 포함할 수 있습니다.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary-filter
" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US
', VocabularyFilterName = vocab_name, Words = [ 'profane
','offensive
','Amazon
','Transcribe
' ] )
옵션 2: 단어 목록을 텍스트 파일로 저장하고Amazon S3 버킷에 업로드한 다음VocabularyFilterFileUri
파라미터를 사용하여 요청에 파일의 URI를 포함할 수 있습니다.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary-filter
" response = transcribe.create_vocabulary_filter( LanguageCode = 'en-US
', VocabularyFilterName = vocab_name, VocabularyFilterFileUri = 's3://DOC-EXAMPLE-BUCKET
/my-vocabulary-filters
/my-vocabulary-filter
.txt' )
참고
요청에 포함하는VocabularyFilterFileUri
경우 사용할Words
수 없으며 둘 중 하나를 선택해야 합니다.
참고
사용자 지정 어휘 필터 파일을 위한 새Amazon S3 버킷을 만드는 경우 CreateVocabularyFilter
요청을 하는IAM 역할에 이 버킷에 액세스할 권한이 있는지 확인하세요. 역할에 올바른 권한이 없는 경우 요청이 실패합니다. DataAccessRoleArn
파라미터를 포함하여 요청 내에서IAM 역할을 선택적으로 지정할 수 있습니다. 의IAM 역할 및 정책에 대한 자세한 내용은Amazon Transcribe 을 참조하십시오Amazon Transcribe 자격 증명 기반 정책 예제.