StartStreamTranscription - Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

StartStreamTranscription

Memulai HTTP/2 dua arah atau WebSocket streaming di mana audio dialirkan ke Amazon Transcribe dan hasil transkripsi dialirkan ke aplikasi Anda.

Parameter berikut diperlukan:

  • language-code atau identify-language

  • media-encoding

  • sample-rate

Untuk informasi selengkapnya tentang streaming dengan Amazon Transcribe, lihat Mentranskripsikan audio streaming.

Minta Sintaks

POST /stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-identify-language: IdentifyLanguage x-amzn-transcribe-language-options: LanguageOptions x-amzn-transcribe-preferred-language: PreferredLanguage x-amzn-transcribe-vocabulary-names: VocabularyNames x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob } } }

Parameter Permintaan URI

Permintaan menggunakan parameter URI berikut.

ContentIdentificationType

Label semua informasi pengenal pribadi (PII) yang dapat diidentifikasi pribadi (PII).

Identifikasi konten dilakukan pada tingkat segmen; PII yangPiiEntityTypes ditentukan ditandai pada transkripsi lengkap segmen audio.

Anda tidak dapat mengaturContentIdentificationType danContentRedactionType dalam permintaan yang sama. Jika Anda mengatur keduanya, permintaan Anda akan mengembalikan fileBadRequestException.

Untuk informasi selengkapnya, lihat Menyunting atau mengidentifikasi informasi identitas pribadi.

Nilai Valid: PII

ContentRedactionType

Menyunting semua informasi pengenal pribadi (PII) yang teridentifikasi dalam transkrip Anda.

Konten redaksi dilakukan pada tingkat segmen; PIIPiiEntityTypes ditentukan di disunting pada transkripsi lengkap dari segmen audio.

Anda tidak dapat mengaturContentRedactionType danContentIdentificationType dalam permintaan yang sama. Jika Anda mengatur keduanya, permintaan Anda akan mengembalikan fileBadRequestException.

Untuk informasi selengkapnya, lihat Menyunting atau mengidentifikasi informasi identitas pribadi.

Nilai Valid: PII

EnableChannelIdentification

Memungkinkan identifikasi saluran dalam audio multi-saluran.

Identifikasi saluran menyalin audio pada setiap saluran secara independen, kemudian menambahkan output untuk setiap saluran ke dalam satu transkrip.

Jika Anda memiliki audio multi-saluran dan tidak mengaktifkan identifikasi saluran, audio Anda ditranskripsikan secara terus menerus dan transkrip Anda tidak dipisahkan oleh saluran.

Jika Anda menyertakanEnableChannelIdentification dalam permintaan Anda, Anda juga harus menyertakanNumberOfChannels.

Untuk informasi selengkapnya, lihat Mentranskripsikan audio multi-saluran.

EnablePartialResultsStabilization

Memungkinkan stabilisasi hasil sebagian untuk transkripsi Anda. Stabilisasi hasil sebagian dapat mengurangi latensi pada output Anda, tetapi dapat memengaruhi akurasi. Untuk informasi lebih lanjut, lihat Stabilisasi hasil paral, lihat Stabilisasi hasil paral,

IdentifyLanguage

Memungkinkan identifikasi bahasa otomatis untuk transkripsi Anda.

Jika Anda menyertakanIdentifyLanguage, Anda dapat secara opsional menyertakan daftar kode bahasa, menggunakanLanguageOptions, yang menurut Anda mungkin ada dalam aliran audio Anda. Termasuk opsi bahasa dapat meningkatkan akurasi transkripsi.

Anda juga dapat menyertakan bahasa pilihan menggunakanPreferredLanguage. Menambahkan bahasa pilihan dapat membantu Amazon Transcribe mengidentifikasi bahasa lebih cepat daripada jika Anda menghilangkan parameter ini.

Jika Anda memiliki audio multi-saluran yang berisi bahasa berbeda di setiap saluran, dan Anda telah mengaktifkan identifikasi saluran, identifikasi bahasa otomatis mengidentifikasi bahasa dominan di setiap saluran audio.

Perhatikan bahwa Anda harus menyertakan salah satuLanguageCode atauIdentifyLanguage dalam permintaan Anda. Jika Anda menyertakan kedua parameter, permintaan Anda gagal.

Identifikasi bahasa streaming tidak dapat digabungkan dengan model atau redaksi bahasa khusus.

LanguageCode

Tentukan kode bahasa yang mewakili bahasa yang digunakan dalam audio Anda.

Jika Anda tidak yakin dengan bahasa yang digunakan dalam audio Anda, pertimbangkanIdentifyLanguage untuk menggunakan untuk mengaktifkan identifikasi bahasa otomatis.

Untuk daftar bahasa yang didukung dengan streaming Amazon Transcribe, lihat tabel Bahasa yang didukung.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

LanguageModelName

Tentukan nama model bahasa khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama model bahasa peka terhadap huruf besar dan kecil.

Bahasa model bahasa yang ditentukan harus sesuai dengan kode bahasa yang Anda tentukan dalam permintaan transkripsi Anda. Jika bahasa tidak cocok, model bahasa kustom tidak diterapkan. Tidak ada kesalahan atau peringatan yang terkait dengan ketidakcocokan bahasa.

Untuk informasi selengkapnya, lihat Model bahasa kustom, lihat Model bahasa kustom, lihat Model bahasa kustom.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

LanguageOptions

Tentukan dua atau lebih kode bahasa yang mewakili bahasa yang menurut Anda mungkin ada di media Anda; termasuk lebih dari lima tidak disarankan. Jika Anda tidak yakin bahasa apa yang ada, jangan sertakan parameter ini.

Termasuk opsi bahasa dapat meningkatkan akurasi identifikasi bahasa.

Jika Anda menyertakanLanguageOptions dalam permintaan Anda, Anda juga harus menyertakanIdentifyLanguage.

Untuk daftar bahasa yang didukung dengan streaming Amazon Transcribe, lihat tabel Bahasa yang didukung.

penting

Anda hanya dapat menyertakan satu dialek bahasa per aliran. Misalnya, Anda tidak dapat menyertakanen-US danen-AU dalam permintaan yang sama.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[a-zA-Z-,]+

MediaEncoding

Tentukan pengkodean audio input Anda. Format yang didukung adalah:

  • FLAC

  • Audio yang dikodekan oleh opus dalam wadah Ogg

  • PCM (hanya format audio 16-bit little-endian yang ditandatangani, yang tidak termasuk WAV)

Untuk informasi selengkapnya, lihat Format media.

Nilai Valid: pcm | ogg-opus | flac

Wajib: Ya

MediaSampleRateHertz

Laju sampel audio input (dalam hertz). Audio berkualitas rendah, seperti audio telepon, biasanya sekitar 8.000 Hz. Audio berkualitas tinggi biasanya berkisar dari 16.000 Hz hingga 48.000 Hz. Perhatikan bahwa laju sampel yang Anda tentukan harus sesuai dengan audio Anda.

Rentang yang Valid: minimum: Nilai minimum 8000. Nilai maksimum 48000.

Wajib: Ya

NumberOfChannels

Tentukan jumlah saluran di streaming audio Anda. Nilai ini harus2, karena hanya dua saluran yang didukung. Jika audio Anda tidak berisi beberapa saluran, jangan sertakan parameter ini dalam permintaan Anda.

Jika Anda menyertakanNumberOfChannels dalam permintaan Anda, Anda juga harus menyertakanEnableChannelIdentification.

Rentang yang Valid: minimum: Nilai minimum 2.

PartialResultsStability

Tentukan tingkat stabilitas yang akan digunakan saat Anda mengaktifkan stabilisasi hasil sebagian (EnablePartialResultsStabilization).

Stabilitas rendah memberikan akurasi tertinggi. Stabilitas tinggi menyalin lebih cepat, tetapi dengan akurasi yang sedikit lebih rendah.

Untuk informasi lebih lanjut, lihat Stabilisasi hasil paral, lihat Stabilisasi hasil paral,

Nilai Valid: high | medium | low

PiiEntityTypes

Tentukan tipe informasi pengenal pribadi (PII) yang ingin Anda edit dalam transkrip Anda. Anda dapat menyertakan sebanyak mungkin jenis yang Anda inginkan, atau Anda dapat memilihALL.

Untuk menyertakanPiiEntityTypes dalam permintaan Anda, Anda juga harus menyertakan salah satuContentIdentificationType atauContentRedactionType.

Nilai harus dipisahkan koma dan dapat mencakup:ADDRESS,,,BANK_ACCOUNT_NUMBER,BANK_ROUTING,CREDIT_DEBIT_CVV,CREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAIL,NAME,PHONE,PIN,SSN, atauALL.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 300.

Pola: ^[A-Z_, ]+

PreferredLanguage

Tentukan bahasa pilihan dari subset kode bahasa yang Anda tentukanLanguageOptions.

Anda hanya dapat menggunakan parameter ini jika Anda telah menyertakanIdentifyLanguage danLanguageOptions dalam permintaan Anda.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

SessionId

Tentukan nama untuk sesi transkripsi Anda. Jika Anda tidak menyertakan parameter ini dalam permintaan Anda, Amazon Transcribe akan menghasilkan ID dan mengembalikannya dalam respons.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Memungkinkan partisi speaker (diarization) dalam output transkripsi Anda. Pembicara partisi label pidato dari speaker individu dalam file media Anda.

Untuk informasi lebih lanjut, lihat Partisi speaker (diarisasi).

VocabularyFilterMethod

Tentukan bagaimana Anda ingin filter kosakata Anda diterapkan pada transkrip Anda.

Untuk mengganti kata-kata dengan***, pilihmask.

Untuk menghapus kata, pilihremove.

Untuk menandai kata-kata tanpa mengubahnya, pilihtag.

Nilai Valid: remove | mask | tag

VocabularyFilterName

Tentukan nama filter kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama filter kosakata peka terhadap huruf besar dan kecil.

Jika bahasa filter kosakata kustom yang ditentukan tidak cocok dengan bahasa yang diidentifikasi di media Anda, filter kosakata tidak diterapkan ke transkripsi Anda.

penting

Parameter ini tidak dimaksudkan untuk digunakan denganIdentifyLanguage parameter. Jika Anda termasukIdentifyLanguage dalam permintaan Anda dan ingin menggunakan satu atau beberapa filter kosakata dengan transkripsi Anda, gunakanVocabularyFilterNames parameter sebagai gantinya.

Untuk informasi selengkapnya, lihat Menggunakan pemfilteran kosakata dengan kata-kata yang tidak diinginkan.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyFilterNames

Tentukan nama filter kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama filter kosakata peka terhadap huruf besar dan kecil.

Jika tidak ada bahasa filter kosakata khusus yang ditentukan yang cocok dengan bahasa yang diidentifikasi di media Anda, pekerjaan Anda gagal.

penting

Parameter ini hanya dimaksudkan untuk digunakan denganIdentifyLanguage parameter. Jika Anda tidak termasukIdentifyLanguage dalam permintaan Anda dan ingin menggunakan kosakata kustom filter dengan transkripsi Anda, gunakanVocabularyFilterName parameter sebagai gantinya.

Untuk informasi selengkapnya, lihat Menggunakan pemfilteran kosakata dengan kata-kata yang tidak diinginkan.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 3000.

Pola: ^[a-zA-Z0-9,-._]+

VocabularyName

Tentukan nama kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama kosakata itu peka terhadap huruf besar dan kecil.

Jika bahasa kosakata kustom yang ditentukan tidak cocok dengan bahasa yang diidentifikasi di media Anda, kosakata kustom tidak diterapkan pada transkripsi Anda.

penting

Parameter ini tidak dimaksudkan untuk digunakan denganIdentifyLanguage parameter. Jika Anda termasukIdentifyLanguage dalam permintaan Anda dan ingin menggunakan satu atau beberapa kosakata kustom dengan transkripsi Anda, gunakanVocabularyNames parameter sebagai gantinya.

Untuk informasi selengkapnya, lihat Kosakata khusus.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyNames

Tentukan nama kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama kosakata itu peka terhadap huruf besar dan kecil.

Jika tidak ada bahasa dari kosakata khusus yang ditentukan yang cocok dengan bahasa yang diidentifikasi di media Anda, pekerjaan Anda gagal.

penting

Parameter ini hanya dimaksudkan untuk digunakan denganIdentifyLanguage parameter. Jika Anda tidak termasukIdentifyLanguage dalam permintaan Anda dan ingin menggunakan kosakata kustom dengan transkripsi Anda, gunakanVocabularyName parameter sebagai gantinya.

Untuk informasi selengkapnya, lihat Kosakata khusus.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 3000.

Pola: ^[a-zA-Z0-9,-._]+

Isi Permintaan

Permintaan menerima data berikut dalam format JSON.

AudioStream

Aliran gumpalan audio yang dikodekan. Aliran audio dikodekan sebagai HTTP/2 atau bingkai WebSocket data.

Untuk informasi selengkapnya, lihat Mentranskripsikan audio streaming.

Tipe: Objek AudioStream

Wajib: Ya

Sintaksis Respons

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification x-amzn-transcribe-number-of-channels: NumberOfChannels x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-identify-language: IdentifyLanguage x-amzn-transcribe-language-options: LanguageOptions x-amzn-transcribe-preferred-language: PreferredLanguage x-amzn-transcribe-vocabulary-names: VocabularyNames x-amzn-transcribe-vocabulary-filter-names: VocabularyFilterNames Content-type: application/json { "TranscriptResultStream": { "BadRequestException": { }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "TranscriptEvent": { "Transcript": { "Results": [ { "Alternatives": [ { "Entities": [ { "Category": "string", "Confidence": number, "Content": "string", "EndTime": number, "StartTime": number, "Type": "string" } ], "Items": [ { "Confidence": number, "Content": "string", "EndTime": number, "Speaker": "string", "Stable": boolean, "StartTime": number, "Type": "string", "VocabularyFilterMatch": boolean } ], "Transcript": "string" } ], "ChannelId": "string", "EndTime": number, "IsPartial": boolean, "LanguageCode": "string", "LanguageIdentification": [ { "LanguageCode": "string", "Score": number } ], "ResultId": "string", "StartTime": number } ] } } } }

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Respons mengembalikan header HTTP berikut.

ContentIdentificationType

Menunjukkan apakah identifikasi konten diaktifkan untuk transkripsi Anda.

Nilai Valid: PII

ContentRedactionType

Menunjukkan apakah redaksi konten diaktifkan untuk transkripsi Anda.

Nilai Valid: PII

EnableChannelIdentification

Menunjukkan apakah identifikasi saluran diaktifkan untuk transkripsi Anda.

EnablePartialResultsStabilization

Menunjukkan apakah stabilisasi hasil sebagian diaktifkan untuk transkripsi Anda.

IdentifyLanguage

Menunjukkan apakah identifikasi bahasa otomatis diaktifkan untuk transkripsi Anda.

LanguageCode

Menyediakan kode bahasa yang Anda tentukan dalam permintaan Anda.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

LanguageModelName

Menyediakan nama model bahasa kustom yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

LanguageOptions

Menyediakan kode bahasa yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[a-zA-Z-,]+

MediaEncoding

Menyediakan pengkodean media yang Anda tentukan dalam permintaan Anda.

Nilai Valid: pcm | ogg-opus | flac

MediaSampleRateHertz

Memberikan laju sampel yang Anda tentukan dalam permintaan Anda.

Rentang yang Valid: minimum: Nilai minimum 8000. Nilai maksimum 48000.

NumberOfChannels

Menyediakan jumlah saluran yang Anda tentukan dalam permintaan Anda.

Rentang yang Valid: minimum: Nilai minimum 2.

PartialResultsStability

Menyediakan tingkat stabilisasi yang digunakan untuk transkripsi Anda.

Nilai Valid: high | medium | low

PiiEntityTypes

Daftar jenis entitas PII yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 300.

Pola: ^[A-Z_, ]+

PreferredLanguage

Menyediakan bahasa pilihan yang Anda tentukan dalam permintaan Anda.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH

RequestId

Menyediakan pengenal untuk permintaan streaming Anda.

SessionId

Menyediakan pengenal untuk sesi transkripsi Anda.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

Menunjukkan apakah partisi pembicara diaktifkan untuk transkripsi Anda.

VocabularyFilterMethod

Menyediakan metode penyaringan kosakata yang digunakan dalam transkripsi Anda.

Nilai Valid: remove | mask | tag

VocabularyFilterName

Menyediakan nama filter kosakata khusus yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyFilterNames

Menyediakan nama filter kosakata khusus yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 3000.

Pola: ^[a-zA-Z0-9,-._]+

VocabularyName

Menyediakan nama kosakata khusus yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyNames

Menyediakan nama-nama kosakata khusus yang Anda tentukan dalam permintaan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 3000.

Pola: ^[a-zA-Z0-9,-._]+

Layanan mengembalikan data berikut dalam format JSON.

TranscriptResultStream

Memberikan informasi terperinci tentang sesi streaming Anda.

Tipe: Objek TranscriptResultStream

Kesalahan

Untuk informasi tentang kesalahan yang umum untuk semua tindakan, lihat Kesalahan Umum.

BadRequestException

Satu atau lebih argumen untukStartStreamTranscriptionStartMedicalStreamTranscription,, atauStartCallAnalyticsStreamTranscription operasi tidak valid. Misalnya,MediaEncoding atauLanguageCode menggunakan nilai yang tidak didukung. Periksa parameter yang ditentukan dan coba permintaan Anda lagi.

Kode Status HTTP: 400

ConflictException

Aliran baru dimulai dengan ID sesi yang sama. Aliran saat ini telah dihentikan.

Kode Status HTTP: 409

InternalFailureException

Masalah terjadi saat memproses audio. Amazon Transcribe menghentikan pemrosesan.

Kode Status HTTP: 500

LimitExceededException

Klien Anda telah melampaui salah satu batas Amazon Transcribe. Ini biasanya batas panjang audio. Pecahkan aliran audio Anda menjadi potongan yang lebih kecil dan coba lagi permintaan Anda.

Kode Status HTTP: 429

ServiceUnavailableException

Layanan ini saat ini tidak tersedia. Coba permintaan Anda nanti.

Kode Status HTTP: 503

Lihat Juga

Untuk informasi selengkapnya tentang penggunaan API ini di salah satuAWS SDK khusus bahasa, lihat yang berikut ini: