기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
StartMedicalStreamTranscription
양방향 HTTP/2 또는 WebSocket 스트림을 시작하여 오디오를 Transcribe Medical로 스트리밍하고 트랜스크립션 결과를 애플리케이션으로 스트리밍합니다.
다음 파라미터는 필수 파라미터입니다.
-
language-code
-
media-encoding
-
sample-rate
Amazon Transcribe Medical을 사용한 스트리밍에 대한 자세한 내용은 스트리밍 오디오 텍스트 변환을 참조하십시오.
요청 구문
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
URI 요청 파라미터
요청은 다음의 URI 파라미터를 사용합니다.
- ContentIdentificationType
-
트랜스크립트에 명시된 모든 개인 건강 정보 (PHI) 에 라벨을 붙입니다.
콘텐츠 식별은 세그먼트 수준에서 수행되며, PHI는 오디오 세그먼트가 완전히 변환되면 플래그가 지정됩니다.
자세한 내용은 필사본에서 개인 건강 정보 (PHI) 식별을 참조하십시오.
유효한 값:
PHI
- EnableChannelIdentification
-
멀티 채널 오디오에서 채널 식별을 활성화합니다.
채널 식별은 각 채널의 오디오를 개별적으로 변환한 다음 각 채널의 출력을 하나의 트랜스크립트에 추가합니다.
다중 채널 오디오가 있고 채널 식별을 활성화하지 않은 경우 오디오는 연속적으로 변환되며 트랜스크립트는 채널별로 구분되지 않습니다.
요청에 포함시키는
EnableChannelIdentification
경우 포함해야 합니다NumberOfChannels
.자세한 내용은 다중 채널 오디오 텍스트 변환을 참조하십시오.
- LanguageCode
-
오디오에서 사용되는 언어를 나타내는 언어 코드를 지정합니다.
중요
Amazon Transcribe 메디컬은 미국 영어 (
en-US
) 만 지원합니다.유효한 값:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
필수 항목 여부: 예
- MediaEncoding
-
입력 오디오에 사용되는 인코딩을 지정합니다. 지원되는 형식:
-
FLAC
-
Ogg 컨테이너의 Opus 인코딩 오디오
-
PCM (부호가 있는 16비트 리틀 엔디안 오디오 형식만 해당, WAV는 포함되지 않음)
자세한 내용은 미디어 형식을 참조하십시오.
유효한 값:
pcm | ogg-opus | flac
필수 항목 여부: 예
-
- MediaSampleRateHertz
-
입력 오디오의 샘플 레이트 (헤르츠 단위). Amazon Transcribe 메디컬은 16,000Hz에서 48,000Hz까지의 범위를 지원합니다. 지정한 샘플 속도는 오디오의 샘플 속도와 일치해야 합니다.
유효한 범위: 최소값 8000입니다. 최대값은 4800입니다.
필수 항목 여부: 예
- NumberOfChannels
-
오디오 스트림의 채널 수를 지정합니다. 두 채널만
2
지원되므로 이 값은 이어야 합니다. 오디오에 여러 채널이 포함되어 있지 않은 경우 요청에 이 매개변수를 포함하지 마세요.요청에 포함시키는
NumberOfChannels
경우 포함해야 합니다EnableChannelIdentification
.유효한 범위: 최소값 2.
- SessionId
-
트랜스크립션 세션의 이름을 지정하십시오. 요청에 이 파라미터를 포함하지 않는 경우 Amazon Transcribe Medical은 ID를 생성하여 응답에 반환합니다.
길이 제약 조건: 고정 길이는 36입니다.
패턴:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
트랜스크립션 출력에서 스피커 파티셔닝 (다이어리제이션) 을 활성화합니다. 스피커 파티셔닝은 미디어 파일에 있는 개별 스피커의 음성에 레이블을 지정합니다.
자세한 내용은 스피커 파티셔닝 (다이얼라이제이션) 을 참조하세요.
- Specialty
-
오디오에 포함된 의료 전문 분야를 지정하십시오.
유효한 값:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
필수 항목 여부: 예
- Type
-
입력 오디오 유형을 지정합니다. 예를 들어, 의료 전문가가 환자 메모를 받아쓰거나 환자와
CONVERSATION
의료 전문가 간의 대화를 받아쓰도록 선택할DICTATION
수 있습니다.유효한 값:
CONVERSATION | DICTATION
필수 항목 여부: 예
- VocabularyName
-
트랜스크립션을 처리할 때 사용할 사용자 지정 어휘의 이름을 지정하십시오. 참고로 어휘 이름은 대/소문자를 구분합니다.
길이 제약: 최소 길이는 1입니다. 최대 길이는 200입니다.
패턴:
^[0-9a-zA-Z._-]+
요청 본문
요청은 JSON 형식의 다음 데이터를 받습니다.
- AudioStream
-
인코딩된 오디오 블롭 스트림입니다. 오디오 스트림은 HTTP/2 또는 WebSocket 데이터 프레임으로 인코딩됩니다.
자세한 내용은 스트리밍 오디오 텍스트 변환을 참조하십시오.
유형: AudioStream 객체
필수 항목 여부: 예
응답 구문
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
응답 요소
작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.
응답에 다음 HTTP 헤더가 반환됩니다.
- ContentIdentificationType
-
트랜스크립션에 콘텐츠 식별이 활성화되었는지 여부를 보여줍니다.
유효한 값:
PHI
- EnableChannelIdentification
-
트랜스크립션에 채널 식별이 활성화되었는지 여부를 보여줍니다.
- LanguageCode
-
요청에서 지정한 언어 코드를 제공합니다. 반드시
en-US
이여야 합니다.유효한 값:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- MediaEncoding
-
요청에서 지정한 미디어 인코딩을 제공합니다.
유효한 값:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
요청에서 지정한 샘플 속도를 제공합니다.
유효한 범위: 최소값 8000입니다. 최대값은 4800입니다.
- NumberOfChannels
-
요청에서 지정한 채널 수를 제공합니다.
유효한 범위: 최소값 2.
- RequestId
-
스트리밍 요청의 식별자를 제공합니다.
- SessionId
-
트랜스크립션 세션의 식별자를 제공합니다.
길이 제약 조건: 고정 길이는 36입니다.
패턴:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
트랜스크립션에 스피커 파티셔닝이 활성화되었는지 여부를 표시합니다.
- Specialty
-
요청서에 지정한 의료 전문 분야를 제공합니다.
유효한 값:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
- Type
-
요청에서 지정한 오디오 유형을 제공합니다.
유효한 값:
CONVERSATION | DICTATION
- VocabularyName
-
요청에서 지정한 사용자 지정 어휘의 이름을 제공합니다.
길이 제약: 최소 길이는 1입니다. 최대 길이는 200입니다.
패턴:
^[0-9a-zA-Z._-]+
다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.
- TranscriptResultStream
-
스트리밍 세션에 대한 세부 정보를 제공합니다.
오류
모든 작업에 공통적으로 발생하는 오류에 대한 자세한 내용은 을 참조하십시오일반적인 오류.
- BadRequestException
-
StartStreamTranscription
StartMedicalStreamTranscription
, 또는StartCallAnalyticsStreamTranscription
연산에 대한 하나 이상의 인수가 유효하지 않습니다. 지원되지 않는 값을LanguageCode
사용한MediaEncoding
경우를 예로 들 수 있습니다. 지정된 파라미터를 확인하고 요청을 다시 시도하세요.HTTP 상태 코드: 400
- ConflictException
-
새 스트림이 동일한 세션 ID로 시작되었습니다. 현재 스트림이 종료되었습니다.
HTTP 상태 코드: 409
- InternalFailureException
-
오디오를 처리하는 동안 문제가 발생했습니다. Amazon Transcribe 처리가 종료되었습니다.
HTTP 상태 코드: 500
- LimitExceededException
-
고객이 Amazon Transcribe 한도 중 하나를 초과했습니다. 이는 일반적으로 오디오 길이 제한입니다. 오디오 스트림을 작은 조각으로 나눈 다음 다시 요청해 보세요.
HTTP 상태 코드: 429
- ServiceUnavailableException
-
이 서비스는 현재 사용할 수 없습니다. 나중에 요청해 보세요.
HTTP 상태 코드: 503
참고 항목
이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.