요청 구문 URI 요청 파라미터 요청 본문 응답 구문 응답 요소 오류 참고 항목

StartMedicalStreamTranscription

양방향 HTTP/2 또는 WebSocket 스트림을 시작하여 오디오를 Transcribe Medical로 스트리밍하고 트랜스크립션 결과를 애플리케이션으로 스트리밍합니다.

다음 파라미터는 필수 파라미터입니다.

language-code
media-encoding
sample-rate

Amazon Transcribe Medical을 사용한 스트리밍에 대한 자세한 내용은 스트리밍 오디오 텍스트 변환을 참조하십시오.

요청 구문


POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      }
   }
}

URI 요청 파라미터

요청은 다음의 URI 파라미터를 사용합니다.

ContentIdentificationType

트랜스크립트에 명시된 모든 개인 건강 정보 (PHI) 에 라벨을 붙입니다.

콘텐츠 식별은 세그먼트 수준에서 수행되며, PHI는 오디오 세그먼트가 완전히 변환되면 플래그가 지정됩니다.

자세한 내용은 필사본에서 개인 건강 정보 (PHI) 식별을 참조하십시오.

유효한 값: PHI

EnableChannelIdentification

멀티 채널 오디오에서 채널 식별을 활성화합니다.

채널 식별은 각 채널의 오디오를 개별적으로 변환한 다음 각 채널의 출력을 하나의 트랜스크립트에 추가합니다.

다중 채널 오디오가 있고 채널 식별을 활성화하지 않은 경우 오디오는 연속적으로 변환되며 트랜스크립트는 채널별로 구분되지 않습니다.

요청에 포함시키는EnableChannelIdentification 경우 포함해야 합니다NumberOfChannels.

자세한 내용은 다중 채널 오디오 텍스트 변환을 참조하십시오.

LanguageCode

오디오에서 사용되는 언어를 나타내는 언어 코드를 지정합니다.

중요

Amazon Transcribe 메디컬은 미국 영어 (en-US) 만 지원합니다.

필수 항목 여부: 예

MediaEncoding

입력 오디오에 사용되는 인코딩을 지정합니다. 지원되는 형식:

FLAC
Ogg 컨테이너의 Opus 인코딩 오디오
PCM (부호가 있는 16비트 리틀 엔디안 오디오 형식만 해당, WAV는 포함되지 않음)

자세한 내용은 미디어 형식을 참조하십시오.

유효한 값: pcm | ogg-opus | flac

필수 항목 여부: 예

MediaSampleRateHertz

입력 오디오의 샘플 레이트 (헤르츠 단위). Amazon Transcribe 메디컬은 16,000Hz에서 48,000Hz까지의 범위를 지원합니다. 지정한 샘플 속도는 오디오의 샘플 속도와 일치해야 합니다.

유효한 범위: 최소값 8000입니다. 최대값은 4800입니다.

필수 항목 여부: 예

NumberOfChannels

오디오 스트림의 채널 수를 지정합니다. 두 채널만2 지원되므로 이 값은 이어야 합니다. 오디오에 여러 채널이 포함되어 있지 않은 경우 요청에 이 매개변수를 포함하지 마세요.

요청에 포함시키는NumberOfChannels 경우 포함해야 합니다EnableChannelIdentification.

유효한 범위: 최소값 2.

SessionId

트랜스크립션 세션의 이름을 지정하십시오. 요청에 이 파라미터를 포함하지 않는 경우 Amazon Transcribe Medical은 ID를 생성하여 응답에 반환합니다.

길이 제약 조건: 고정 길이는 36입니다.

패턴: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

트랜스크립션 출력에서 스피커 파티셔닝 (다이어리제이션) 을 활성화합니다. 스피커 파티셔닝은 미디어 파일에 있는 개별 스피커의 음성에 레이블을 지정합니다.

자세한 내용은 스피커 파티셔닝 (다이얼라이제이션) 을 참조하세요.

Specialty

오디오에 포함된 의료 전문 분야를 지정하십시오.

필수 항목 여부: 예

Type

입력 오디오 유형을 지정합니다. 예를 들어, 의료 전문가가 환자 메모를 받아쓰거나 환자와CONVERSATION 의료 전문가 간의 대화를 받아쓰도록 선택할DICTATION 수 있습니다.

유효한 값: CONVERSATION | DICTATION

필수 항목 여부: 예

VocabularyName

트랜스크립션을 처리할 때 사용할 사용자 지정 어휘의 이름을 지정하십시오. 참고로 어휘 이름은 대/소문자를 구분합니다.

길이 제약: 최소 길이는 1입니다. 최대 길이는 200입니다.

패턴: ^[0-9a-zA-Z._-]+

요청 본문

요청은 JSON 형식의 다음 데이터를 받습니다.

AudioStream

인코딩된 오디오 블롭 스트림입니다. 오디오 스트림은 HTTP/2 또는 WebSocket 데이터 프레임으로 인코딩됩니다.

자세한 내용은 스트리밍 오디오 텍스트 변환을 참조하십시오.

유형: AudioStream 객체

필수 항목 여부: 예

응답 구문


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "TranscriptResultStream": { 
      "BadRequestException": { 
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "TranscriptEvent": { 
         "Transcript": { 
            "Results": [ 
               { 
                  "Alternatives": [ 
                     { 
                        "Entities": [ 
                           { 
                              "Category": "string",
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "StartTime": number
                           }
                        ],
                        "Items": [ 
                           { 
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "Speaker": "string",
                              "StartTime": number,
                              "Type": "string"
                           }
                        ],
                        "Transcript": "string"
                     }
                  ],
                  "ChannelId": "string",
                  "EndTime": number,
                  "IsPartial": boolean,
                  "ResultId": "string",
                  "StartTime": number
               }
            ]
         }
      }
   }
}

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.

응답에 다음 HTTP 헤더가 반환됩니다.

ContentIdentificationType

트랜스크립션에 콘텐츠 식별이 활성화되었는지 여부를 보여줍니다.

유효한 값: PHI

EnableChannelIdentification

트랜스크립션에 채널 식별이 활성화되었는지 여부를 보여줍니다.

LanguageCode

요청에서 지정한 언어 코드를 제공합니다. 반드시 en-US이여야 합니다.

MediaEncoding

요청에서 지정한 미디어 인코딩을 제공합니다.

유효한 값: pcm | ogg-opus | flac

MediaSampleRateHertz

요청에서 지정한 샘플 속도를 제공합니다.

유효한 범위: 최소값 8000입니다. 최대값은 4800입니다.

NumberOfChannels

요청에서 지정한 채널 수를 제공합니다.

유효한 범위: 최소값 2.

RequestId

스트리밍 요청의 식별자를 제공합니다.

SessionId

트랜스크립션 세션의 식별자를 제공합니다.

길이 제약 조건: 고정 길이는 36입니다.

패턴: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

트랜스크립션에 스피커 파티셔닝이 활성화되었는지 여부를 표시합니다.

Specialty

요청서에 지정한 의료 전문 분야를 제공합니다.

Type

요청에서 지정한 오디오 유형을 제공합니다.

유효한 값: CONVERSATION | DICTATION

VocabularyName

요청에서 지정한 사용자 지정 어휘의 이름을 제공합니다.

길이 제약: 최소 길이는 1입니다. 최대 길이는 200입니다.

패턴: ^[0-9a-zA-Z._-]+

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

TranscriptResultStream

스트리밍 세션에 대한 세부 정보를 제공합니다.

유형: MedicalTranscriptResultStream 객체

오류

모든 작업에 공통적으로 발생하는 오류에 대한 자세한 내용은 을 참조하십시오일반적인 오류.

BadRequestException

StartStreamTranscriptionStartMedicalStreamTranscription, 또는StartCallAnalyticsStreamTranscription 연산에 대한 하나 이상의 인수가 유효하지 않습니다. 지원되지 않는 값을LanguageCode 사용한MediaEncoding 경우를 예로 들 수 있습니다. 지정된 파라미터를 확인하고 요청을 다시 시도하세요.

HTTP 상태 코드: 400

ConflictException

새 스트림이 동일한 세션 ID로 시작되었습니다. 현재 스트림이 종료되었습니다.

HTTP 상태 코드: 409

InternalFailureException

오디오를 처리하는 동안 문제가 발생했습니다. Amazon Transcribe 처리가 종료되었습니다.

HTTP 상태 코드: 500

LimitExceededException

고객이 Amazon Transcribe 한도 중 하나를 초과했습니다. 이는 일반적으로 오디오 길이 제한입니다. 오디오 스트림을 작은 조각으로 나눈 다음 다시 요청해 보세요.

HTTP 상태 코드: 429

ServiceUnavailableException

이 서비스는 현재 사용할 수 없습니다. 나중에 요청해 보세요.

HTTP 상태 코드: 503

참고 항목

이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

StartCallAnalyticsStreamTranscription

StartStreamTranscription