사용자 지정 의학 어휘를 사용한 실시간 스트림의 트랜스크립션

실시간 스트림에서 트랜스크립션 정확도를 높이려면 HTTP/2 또는 WebSocket 스트림을 사용하여 사용자 지정 어휘를 사용할 수 있습니다. HTTP/2 요청을 시작하려면 StartMedicalStreamTranscription API를 사용하세요. 사용자 지정 어휘는 , AWS Management ConsoleStartMedicalStreamTranscription API 또는 WebSocket 프로토콜을 사용하여 실시간으로 사용할 수 있습니다.

AWS Management Console 를 사용하여 의료 구술의 스트리밍 오디오를 트랜스크립션하려면 옵션을 선택하여 의료 구술을 트랜스크립션하고 스트림을 시작한 다음 마이크에 말하기 시작합니다.

의료 구술의 스트리밍 오디오를 트랜스크립션하려면(AWS Management Console)

AWS Management Console에 로그인합니다.
탐색 창의 Amazon Transcribe 의료에서 실시간 트랜스크립션을 선택합니다.
의료 전문 분야에는 스트림에서 말하는 임상의의 의료 전문 분야를 선택합니다.
오디오 입력 유형에서 대화 또는 구술을 선택합니다.
추가 설정에서 사용자 지정 어휘를 선택합니다.
1. 어휘 선택에서 사용자 지정 어휘를 선택합니다.
스트리밍 시작을 선택합니다.
마이크에 대고 말합니다.

다음은 HTTP/2 요청 파라미터의 구문입니다.


POST /medical-stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
authorization: Generated value
x-amz-target: com.amazonaws.transcribe.Transcribe.StartMedicalStreamTranscription
x-amz-content-sha256: STREAMING-MED-AWS4-HMAC-SHA256-EVENTS
x-amz-date: 20220208T235959Z
x-amzn-transcribe-session-id: my-first-http2-med-stream
x-amzn-transcribe-language-code: en-US
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000
x-amzn-transcribe-vocabulary-name: my-first-med-vocab
x-amzn-transcribe-specialty: PRIMARYCARE
x-amzn-transcribe-type: CONVERSATION
x-amzn-transcribe-show-speaker-label: true
Content-type: application/vnd.amazon.eventstream
transfer-encoding: chunked

파라미터 설명:

호스트: 호출하려는 로 AWS 리전 (이전 예제의 'us-west-2')를 업데이트 AWS 리전 합니다. 유효한 목록은 및 엔드포인트를 AWS 리전참조하세요. AWS 리전
권한: 생성된 필드. 서명 생성에 대한 자세한 내용은 서명 버전 4로 AWS 요청 서명을 참조하세요.
x-amz-target: 이 필드를 변경하지 말고 이전 예시에 표시된 콘텐츠를 사용하세요.
x-amz-content-sha256: 생성된 필드. 서명 계산에 대한 자세한 내용은 서명 버전 4로 AWS 요청 서명을 참조하세요.
x-amz-date: 서명이 생성된 날짜 및 시간. 형식은 YYYYMMDDTHHMMSSZ입니다. 여기서 YYYY=년, MM=월, DD=일, HH=시간, MM=분, SS=초이고, 'T'와 'Z'는 고정 문자입니다. 자세한 내용은 서명 버전 4의 날짜 처리를 참조하세요.
x-amzn-transcribe-session-id: 스트리밍 세션의 이름.
x-amzn-transcribe-language-code: 입력 오디오에 사용되는 인코딩. 유효한 값 목록은 StartMedicalStreamTranscription 또는 지원되는 언어 및 언어별 기능 섹션을 참조하세요.
x-amzn-transcribe-media-encoding: 입력 오디오에 사용되는 인코딩. 유효한 값은 pcm, ogg-opus, flac입니다.
x-amzn-transcribe-sample-rate: 입력 오디오의 샘플 속도(Hertz).는 8,000Hz~48,000Hz 범위를 Amazon Transcribe 지원합니다. 전화 오디오와 같은 저품질 오디오는 일반적으로 약 8,000Hz입니다. 고품질 오디오의 범위는 일반적으로 16,000Hz에서 48,000Hz입니다. 단, 지정하는 샘플 속도는 오디오의 샘플 속도와 반드시 일치해야 합니다.
x-amzn-transcribe-vocabulary-name: 트랜스크립션에 사용하려는 어휘의 이름.
x-amzn-transcribe-specialty: 트랜스크립션 대상 의료 전문 분야.
x-amzn-transcribe-type: 구술인지 대화인지를 선택하세요.
x-amzn-transcribe-show-speaker-label: 분할을 활성화하려면 이 값이 true여야 합니다.
content-type: 이 필드를 변경하지 말고 이전 예시에 표시된 콘텐츠를 사용하세요.

API를 사용하여 WebSocket 스트림에서 화자를 분할하려면 다음 형식을 사용하여 미리 서명된 URL을 만들고 WebSocket 요청을 시작하여 vocabulary-name을 사용자 지정 어휘의 이름으로 설정하세요.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/medical-stream-transcription-websocket
?language-code=en-US
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=Signature Version 4 signature 
&X-Amz-SignedHeaders=host
&media-encoding=flac
&sample-rate=16000
&session-id=sessionId
&specialty=medicalSpecialty
&type=CONVERSATION
&vocabulary-name=vocabularyName
&show-speaker-label=boolean

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

사용자 지정 의학 어휘를 사용한 오디오 파일 트랜스크립션

Amazon Transcribe Medical용 문자 집합