StartMedicalStreamTranscription - Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

StartMedicalStreamTranscription

Memulai HTTP/2 dua arah atau WebSocket streaming di mana audio dialirkan ke Amazon Transcribe Medical dan hasil transkripsi dialirkan ke aplikasi Anda.

Parameter berikut diperlukan:

  • language-code

  • media-encoding

  • sample-rate

Untuk informasi selengkapnya tentang streaming dengan Amazon Transcribe Medical, lihat Mentranskripsikan audio streaming.

Minta Sintaks

POST /medical-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

Parameter Permintaan URI

Permintaan menggunakan parameter URI berikut.

ContentIdentificationType

Beri label semua informasi kesehatan pribadi (PHI) yang telah ditentukan dalam transkrip Anda.

Identifikasi konten dilakukan pada tingkat segmen; PHI ditandai pada transkripsi lengkap segmen audio.

Untuk informasi selengkapnya, lihat Mengidentifikasi informasi kesehatan pribadi (PHI) dalam transkripsi.

Nilai Valid: PHI

EnableChannelIdentification

Memungkinkan identifikasi saluran dalam audio multi-saluran.

Identifikasi saluran menyalin audio pada setiap saluran secara independen, kemudian menambahkan output untuk setiap saluran ke dalam satu transkrip.

Jika Anda memiliki audio multi-saluran dan tidak mengaktifkan identifikasi saluran, audio Anda ditranskripsikan secara terus menerus dan transkrip Anda tidak dipisahkan oleh saluran.

Jika Anda menyertakanEnableChannelIdentification dalam permintaan, Anda juga harus menyertakanNumberOfChannels.

Untuk informasi selengkapnya, lihat Mentranskripsikan audio multi-saluran.

LanguageCode

Tentukan kode bahasa yang mewakili bahasa yang digunakan dalam audio Anda.

penting

Amazon Transcribe Medical hanya mendukung Bahasa Inggris AS (en-US).

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

Wajib: Ya

MediaEncoding

Tentukan pengkodean yang digunakan untuk input audio. Format yang didukung adalah:

  • FLAC

  • Audio yang dikodekan opus dalam wadah Ogg

  • PCM (hanya format audio 16-bit little-endian yang ditandatangani, yang tidak termasuk WAV)

Untuk informasi selengkapnya, lihat Format media.

Nilai Valid: pcm | ogg-opus | flac

Wajib: Ya

MediaSampleRateHertz

Laju sampel audio input (dalam hertz). Amazon Transcribe Medical mendukung rentang dari 16.000 Hz hingga 48.000 Hz. Perhatikan bahwa laju sampel yang Anda tentukan harus sesuai dengan audio Anda.

Rentang yang Valid: Nilai minimum 8000. Nilai maksimum 48000.

Wajib: Ya

NumberOfChannels

Tentukan jumlah saluran di aliran audio Anda. Nilai ini harus2, karena hanya dua saluran yang didukung. Jika audio Anda tidak berisi beberapa saluran, jangan sertakan parameter ini dalam permintaan Anda.

Jika Anda menyertakanNumberOfChannels dalam permintaan, Anda juga harus menyertakanEnableChannelIdentification.

Rentang yang Valid: Nilai minimum 2.

SessionId

Tentukan nama untuk sesi transkripsi Anda. Jika Anda tidak menyertakan parameter ini dalam permintaan Anda, Amazon Transcribe Medical menghasilkan ID dan mengembalikannya dalam respons.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Memungkinkan partisi speaker (diarization) dalam output transkripsi Anda. Pembicara partisi label pidato dari speaker individu dalam file media Anda.

Untuk informasi lebih lanjut, lihat, speaker partisi (diarization).

Specialty

Tentukan spesialisasi medis yang terkandung dalam audio Anda.

Nilai Valid: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Wajib: Ya

Type

Tentukan jenis input audio. Misalnya, pilihDICTATION penyedia yang mendikte catatan pasien danCONVERSATION untuk dialog antara pasien dan profesional medis.

Nilai Valid: CONVERSATION | DICTATION

Wajib: Ya

VocabularyName

Tentukan nama kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama kosakata peka huruf besar/kecil.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Isi Permintaan

Permintaan menerima data berikut dalam format JSON.

AudioStream

Aliran gumpalan audio yang dikodekan. Aliran audio dikodekan sebagai HTTP/2 atau bingkai WebSocket data.

Untuk informasi lebih lanjut, lihat Mentranskripsikan audio streaming.

Tipe: Objek AudioStream

Wajib: Ya

Sintaksis Respons

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-specialty: Specialty x-amzn-transcribe-type: Type x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-content-identification-type: ContentIdentificationType Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "StartTime": number, "Type": "string" } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "ResultId": "string", "StartTime": number } ] } } } }

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Respons mengembalikan header HTTP berikut.

ContentIdentificationType

Menunjukkan apakah identifikasi konten diaktifkan untuk transkripsi Anda.

Nilai Valid: PHI

EnableChannelIdentification

Menunjukkan apakah identifikasi saluran diaktifkan untuk transkripsi Anda.

LanguageCode

Menyediakan kode bahasa yang Anda tentukan dalam permintaan Anda. Ini harus en-US.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

MediaEncoding

Menyediakan pengkodean media yang Anda tentukan dalam permintaan Anda.

Nilai Valid: pcm | ogg-opus | flac

MediaSampleRateHertz

Memberikan laju sampel yang Anda tentukan dalam permintaan Anda.

Rentang yang Valid: Nilai minimum 8000. Nilai maksimum 48000.

NumberOfChannels

Menyediakan jumlah saluran yang Anda tentukan dalam permintaan Anda.

Rentang yang Valid: Nilai minimum 2.

RequestId

Menyediakan pengenal untuk permintaan streaming Anda.

SessionId

Menyediakan pengenal untuk sesi transkripsi Anda.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Menunjukkan apakah partisi pembicara diaktifkan untuk transkripsi Anda.

Specialty

Menyediakan spesialisasi medis yang Anda tentukan dalam permintaan Anda.

Nilai Valid: PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY

Type

Menyediakan jenis audio yang Anda tentukan dalam permintaan Anda.

Nilai Valid: CONVERSATION | DICTATION

VocabularyName

Menyediakan nama kosakata khusus yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Layanan mengembalikan data berikut dalam format JSON.

TranscriptResultStream

Menyediakan informasi terperinci tentang sesi streaming Anda.

Tipe: Objek MedicalTranscriptResultStream

Kesalahan

Untuk informasi tentang kesalahan yang umum untuk semua tindakan, lihat Kesalahan Umum.

BadRequestException

Satu atau lebih argumen untukStartStreamTranscriptionStartMedicalStreamTranscription,, atauStartCallAnalyticsStreamTranscription operasi tidak valid. Misalnya,MediaEncoding atauLanguageCode menggunakan nilai yang tidak didukung. Periksa parameter yang ditentukan dan coba permintaan Anda lagi.

Kode Status HTTP: 400

ConflictException

Aliran baru dimulai dengan ID sesi yang sama. Aliran saat ini telah dihentikan.

Kode Status HTTP: 409

InternalFailureException

Masalah terjadi saat memproses audio. Amazon Transcribe menghentikan pemrosesan.

Kode Status HTTP: 500

LimitExceededException

Klien Anda telah melampaui salah satu batas Amazon Transcribe. Ini biasanya batas panjang audio. Pecahkan aliran audio Anda menjadi potongan yang lebih kecil dan coba lagi permintaan Anda.

Kode Status HTTP: 429

ServiceUnavailableException

Layanan saat ini tidak tersedia. Coba permintaan Anda nanti.

Kode Status HTTP: 503

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API di salah satu SDK di salah satuAWS SDK khusus bahasa, lihat yang berikut ini: