기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 어휘 사용
사용자 지정 어휘가 생성되면 트랜스크립션 요청에 포함시킬 수 있습니다. 예를 보려면 다음 섹션을 참조하세요.
요청에 포함하려는 사용자 지정 어휘의 언어는 미디어에 지정한 언어 코드와 일치해야 합니다. 언어가 일치하지 않으면 사용자 지정 어휘가 트랜스크립션에 적용되지 않으며 경고나 오류도 없습니다.
배치 트랜스크립션에서의 사용자 지정 어휘 사용
배치 트랜스크립션과 함께 사용자 지정 어휘를 사용하려면 다음 예를 참조하세요.
-
AWS Management Console
에 로그인합니다. -
탐색 창에서 트랜스크립션 작업을 선택한 다음 작업 생성(오른쪽 상단)을 선택합니다. 그러면 작업 세부 정보 지정 페이지가 열립니다.
작업 이름을 지정하고 입력 미디어를 지정합니다. 필요에 따라 다른 필드를 모두 포함하고 다음을 선택합니다.
-
작업 구성 페이지 하단의 사용자 지정 패널에서 사용자 지정 어휘를 켭니다.
-
드롭다운 메뉴에서 사용자 지정 어휘를 선택합니다.
작업 생성을 선택하여 트랜스크립션 작업을 실행합니다.
이 예시에서는 start-transcription-jobSettings
파라미터를 VocabularyName
하위 파라미터와 함께 사용합니다. 자세한 내용은 StartTranscriptionJob
및 Settings
단원을 참조하세요.
aws transcribe start-transcription-job \ --region
us-west-2
\ --transcription-job-namemy-first-transcription-job
\ --media MediaFileUri=s3://amzn-s3-demo-bucket
/my-input-files
/my-media-file
.flac
\ --output-bucket-nameamzn-s3-demo-bucket
\ --output-keymy-output-files
/ \ --language-codeen-US
\ --settings VocabularyName=my-first-vocabulary
다음은 start-transcription-job
aws transcribe start-transcription-job \ --region
us-west-2
\ --cli-input-json file://my-first-vocabulary-job
.json
my-first-vocabulary-job.json 파일에는 다음과 같은 요청 본문이 포함되어 있습니다.
{
"TranscriptionJobName": "my-first-transcription-job
",
"Media": {
"MediaFileUri": "s3://amzn-s3-demo-bucket
/my-input-files
/my-media-file
.flac
"
},
"OutputBucketName": "amzn-s3-demo-bucket
",
"OutputKey": "my-output-files
/",
"LanguageCode": "en-US
",
"Settings": {
"VocabularyName": "my-first-vocabulary
"
}
}
이 예제에서는 AWS SDK for Python (Boto3) 를 사용하여 start_transcription_jobSettings
인수를 사용하여 사용자 지정 어휘를 포함합니다. 자세한 내용은 StartTranscriptionJob
및 Settings
단원을 참조하세요.
기능별, 시나리오 및 교차 서비스 예제 AWS SDKs를 사용하는 추가 예제는 AWS SDKs를 사용한 Amazon Transcribe의 코드 예제장을 참조하세요.
from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2
')
job_name = "my-first-transcription-job
"
job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-media-file
.flac
"
transcribe.start_transcription_job(
TranscriptionJobName = job_name,
Media = {
'MediaFileUri': job_uri
},
OutputBucketName = 'amzn-s3-demo-bucket
',
OutputKey = 'my-output-files
/',
LanguageCode = 'en-US
',
Settings = {
'VocabularyName': 'my-first-vocabulary
'
}
)
while True:
status = transcribe.get_transcription_job(TranscriptionJobName = job_name)
if status['TranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
break
print("Not ready yet...")
time.sleep(5)
print(status)
스트리밍 트랜스크립션에서의 사용자 지정 어휘 사용
스트리밍 트랜스크립션과 함께 사용자 지정 어휘를 사용하려면 다음 예를 참조하세요.
-
AWS Management Console
에 로그인합니다. -
탐색 창에서 실시간 트랜스크립션을 선택합니다. 사용자 지정까지 아래로 스크롤하고 최소화된 경우 이 필드를 확장합니다.
-
사용자 지정 어휘를 켜고 드롭다운 메뉴에서 사용자 지정 어휘를 선택합니다.
스트림에 적용하려는 기타 설정을 포함합니다.
-
이제 스트림을 트랜스크립션할 준비가 되었습니다. 스트리밍 시작을 선택하고 말하기 시작합니다. 구술을 끝내려면 스트리밍 중지를 선택합니다.
이 예시에서는 사용자 지정 어휘가 포함된 HTTP/2 요청을 생성합니다. 에서 HTTP/2 스트리밍을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요HTTP/2 스트림 설정. Amazon Transcribe관련 파라미터 및 헤더에 대한 자세한 내용은 StartStreamTranscription
을 참조하세요.
POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2
.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208
T235959
Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key
/20220208
/us-west-2
/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-vocabulary
transfer-encoding: chunked
파라미터 정의는 API 참조에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.
이 예시에서는 사용자 지정 어휘를 WebSocket 스트림에 적용하는 미리 서명된 URL을 만듭니다. 가독성을 높이기 위해 줄바꿈이 추가되었습니다. 에서 WebSocket 스트림을 사용하는 방법에 대한 자세한 내용은 섹션을 Amazon Transcribe참조하세요WebSocket 스트림 설정. 파라미터에 대한 자세한 내용은 StartStreamTranscription
을 참조하세요.
GET wss://transcribestreaming.
us-west-2
.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE
%2F20220208
%2Fus-west-2
%2Ftranscribe
%2Faws4_request &X-Amz-Date=20220208
T235959
Z &X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &language-code=en-US
&media-encoding=flac
&sample-rate=16000
&vocabulary-name=my-first-vocabulary
파라미터 정의는 API 참조에서 찾을 수 있습니다. 모든 AWS API 작업에 공통적인 파라미터는 공통 파라미터 섹션에 나열되어 있습니다.