リクエストの構文 URI リクエストパラメータリクエストボディレスポンスの構文レスポンス要素エラー以下の資料も参照してください。

StartMedicalStreamTranscription

双方向 HTTP/2 を開始します。オーディオが Amazon Transcribe Medical WebSocket にストリーミングされると、文字起こしの結果がアプリケーションにストリーミングされます。

以下のパラメータは必須です。

language-code
media-encoding
sample-rate

Amazon Transcribe Medical でのストリーミングの詳細については、ストリーミング音声の文字起こしを参照してください。

リクエストの構文


POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      }
   }
}

URI リクエストパラメータ

リクエストでは、次の URI パラメータを使用します。

ContentIdentificationType

トランスクリプトで特定されたすべての個人の健康情報 (PHI) にラベル付けします。

コンテンツの識別はセグメントレベルで行われ、PHIはオーディオセグメントの文字起こしが完了するとフラグが付けられます。

詳細については、トランスクリプションにおける個人の健康情報 (PHI) の特定を参照してください。

有効な値: PHI

EnableChannelIdentification

マルチチャネルの音声でチャネル識別を有効にします。

チャンネル識別では、各チャンネルのオーディオが個別に文字変換され、各チャンネルの出力が 1 つのトランスクリプトに追加されます。

マルチチャンネルオーディオを使用していて、チャンネル識別が有効になっていない場合、オーディオは連続的に文字変換され、トランスクリプトはチャンネルごとに区切られません。

EnableChannelIdentificationリクエストに含める場合は、その内容も含める必要がありますNumberOfChannels。

詳細については、[マルチチャンネルオーディオの文字起こし] を参照してください。

LanguageCode

音声で話されている言語を表す言語コードを指定します。

重要

Amazon トランスクリプブメディカルは米国英語 (en-US) のみをサポートしています。

必須: はい

MediaEncoding

入力オーディオに使用されるエンコーディングを指定します。サポートされる形式:

FLAC
Ogg コンテナ内の OPUS エンコードオーディオ
PCM (符号付き 16 ビットリトルエンディアンオーディオフォーマットのみ、WAV は含まない)

詳しくは、「メディアフォーマット」を参照してください。

有効な値: pcm | ogg-opus | flac

必須: はい

MediaSampleRateHertz

入力オーディオのサンプルレート (Hz 単位)。Amazon Transcribe Medical では、16,000 Hz ～ 48,000 Hz の範囲がサポートされます。指定するサンプルレートは、音声のサンプルレートと一致する必要があることに注意してください。

有効範囲: 最小値は 8,000 です。最大値は 48,000 です。

必須: はい

NumberOfChannels

オーディオストリーミングのチャネル数を指定します。2 つのチャネルしかサポートされていないため2、この値はでなければなりません。音声に複数のチャンネルが含まれていない場合は、このパラメーターをリクエストに含めないでください。

NumberOfChannelsリクエストに含める場合は、その内容も含める必要がありますEnableChannelIdentification。

値の範囲: 最小値は 2 です。

SessionId

トランスクリプションセッションの名前を指定します。このパラメータをリクエストに含めない場合、Amazon Transcribe Medical は ID を生成し、レスポンスの中でそれを返します。

長さの制限: 最大長は 36 です。

パターン: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

トランスクリプション出力のスピーカーパーティショニング (ダイアライゼーション) を有効にします。スピーカーパーティショニングは、メディアファイル内の個々のスピーカーからのスピーチにラベルを付けます。

詳細については、「スピーカーのパーティショニング (ダイアライゼーション)」を参照してください。

Specialty

オーディオに含まれる専門分野を指定してください。

必須: はい

Type

入力オーディオのタイプを指定します。たとえば、医療提供者が患者のメモを口述したり、CONVERSATION患者と医療専門家が対話したりするようにします。DICTATION

有効な値: CONVERSATION | DICTATION

必須: はい

VocabularyName

トランスクリプションの処理時に使用するカスタムボキャブラリーの名前を指定します。語彙名では大文字と小文字が区別されます。

長さの制限: 最小長は 1 です。最大長は 200 です。

Pattern: ^[0-9a-zA-Z._-]+

リクエストボディ

リクエストは以下の JSON 形式のデータを受け入れます。

AudioStream

エンコードされたオーディオブロブのストリーミング。オーディオストリームは HTTP/2 WebSocket またはデータフレームとしてエンコードされます。

詳細については、ストリーミング音声の文字起こしを参照してください。

型: AudioStream オブジェクト

必須: はい

レスポンスの構文


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "TranscriptResultStream": { 
      "BadRequestException": { 
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "TranscriptEvent": { 
         "Transcript": { 
            "Results": [ 
               { 
                  "Alternatives": [ 
                     { 
                        "Entities": [ 
                           { 
                              "Category": "string",
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "StartTime": number
                           }
                        ],
                        "Items": [ 
                           { 
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "Speaker": "string",
                              "StartTime": number,
                              "Type": "string"
                           }
                        ],
                        "Transcript": "string"
                     }
                  ],
                  "ChannelId": "string",
                  "EndTime": number,
                  "IsPartial": boolean,
                  "ResultId": "string",
                  "StartTime": number
               }
            ]
         }
      }
   }
}

レスポンス要素

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

レスポンスでは、以下の HTTP ヘッダーが返されます。

ContentIdentificationType

トランスクリプションでコンテンツ識別が有効になっているかどうかを示します。

有効な値: PHI

EnableChannelIdentification

トランスクリプションでチャンネル識別が有効になっているかどうかが表示されます。

LanguageCode

リクエストで指定した言語コードを提供します。これは、en-US である必要があります。

MediaEncoding

リクエストで指定したメディアエンコーディングを提供します。

有効な値: pcm | ogg-opus | flac

MediaSampleRateHertz

リクエストで指定したサンプルレートを提供します。

有効範囲: 最小値は 8,000 です。48,000 の最大値。

NumberOfChannels

リクエストで指定したチャンネル数を提供します。

値の範囲: 最小値は 2 です。

RequestId

ストリーミングリクエストの識別子を提供します。

SessionId

トランスクリプションセッションの識別子を提供します。

長さの制限: 最大長は 36 です。

パターン: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

トランスクリプションでスピーカーパーティショニングが有効になっているかどうかが表示されます。

Specialty

リクエストで指定した専門医療を提供します。

Type

リクエストで指定したオーディオのタイプを提供します。

有効な値: CONVERSATION | DICTATION

VocabularyName

リクエストで指定したカスタムボキャブラリーの名前を指定します。

長さの制限: 最小長は 1 です。最大長は 200 です。

Pattern: ^[0-9a-zA-Z._-]+

サービスから以下のデータが JSON 形式で返されます。

TranscriptResultStream

ストリーミングセッションに関する詳細情報を提供します。

型: MedicalTranscriptResultStream オブジェクト

エラー

すべてのアクションに共通のエラーについては、「共通エラー」を参照してください。

BadRequestException

StartStreamTranscription、StartMedicalStreamTranscription、StartCallAnalyticsStreamTranscriptionまたは操作の 1 つまたは複数の引数が無効でした。たとえば、MediaEncodingLanguageCodeまたはサポートされていない値を使用しました。指定されたパラメーターを確認して、リクエストを再度試みてください。

HTTP ステータスコード: 400

ConflictException

同じセッション ID で新しいストリーミングが開始されました。現在のストリーミングは終了しました。

HTTP ステータスコード: 409

InternalFailureException

音声処理中に問題が発生しました。Amazon Transcribe が処理を終了しました。

HTTP ステータスコード: 500

LimitExceededException

クライアントが Amazon Transcribe の制限の 1 つを超えています。これは通常、オーディオの長さの制限です。オーディオストリームをより小さなチャンクに分割して、リクエストを再試行してください。

HTTP ステータスコード: 429

ServiceUnavailableException

現在、サービスをご利用いただけません。後でリクエストを試してください。

HTTP ステータスコード: 503

以下の資料も参照してください。

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、以下を参照してください。

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

StartCallAnalyticsStreamTranscription

StartStreamTranscription