StartCallAnalyticsStreamTranscription - Transcribe

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

StartCallAnalyticsStreamTranscription

Memulai HTTP/2 dua arah atau WebSocket streaming di mana audio dialirkan ke Amazon Transcribe dan hasil transkripsi dialirkan ke aplikasi Anda. Gunakan operasi ini untuk transkripsi Call Analytics.

Parameter berikut diperlukan:

  • language-code

  • media-encoding

  • sample-rate

Untuk informasi selengkapnya tentang streaming dengan Amazon Transcribe, lihat Mentranskripsikan audio streaming.

Minta Sintaks

POST /call-analytics-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob }, "ConfigurationEvent": { "ChannelDefinitions": [ { "ChannelId": number, "ParticipantRole": "string" } ], "PostCallAnalyticsSettings": { "ContentRedactionOutput": "string", "DataAccessRoleArn": "string", "OutputEncryptionKMSKeyId": "string", "OutputLocation": "string" } } } }

Parameter Permintaan URI

Permintaan menggunakan parameter URI berikut.

ContentIdentificationType

Label informasi pengenal pribadi (PII) yang teridentifikasi dalam transkrip Anda.

Identifikasi konten dilakukan pada tingkat segmen; PII yangPiiEntityTypes ditentukan ditandai pada transkripsi lengkap segmen audio.

Anda tidak dapat mengaturContentIdentificationType danContentRedactionType dalam permintaan yang sama. Jika Anda mengatur keduanya, permintaan Anda akan mengembalikan fileBadRequestException.

Untuk informasi selengkapnya, lihat Menyunting atau mengidentifikasi informasi identitas pribadi.

Nilai Valid: PII

ContentRedactionType

Menyunting semua informasi pengenal pribadi (PII) yang teridentifikasi dalam transkrip Anda.

Konten redaksi dilakukan pada tingkat segmen; PIIPiiEntityTypes ditentukan di disunting pada transkripsi lengkap dari segmen audio.

Anda tidak dapat mengaturContentRedactionType danContentIdentificationType dalam permintaan yang sama. Jika Anda mengatur keduanya, permintaan Anda akan mengembalikan fileBadRequestException.

Untuk informasi selengkapnya, lihat Menyunting atau mengidentifikasi informasi identitas pribadi.

Nilai Valid: PII

EnablePartialResultsStabilization

Memungkinkan stabilisasi hasil sebagian untuk transkripsi Anda. Stabilisasi hasil sebagian dapat mengurangi latensi pada output Anda, tetapi dapat memengaruhi akurasi. Untuk informasi lebih lanjut, lihat Stabilisasi hasil parsial.

LanguageCode

Tentukan kode bahasa yang mewakili bahasa yang digunakan dalam audio Anda.

Jika Anda tidak yakin dengan bahasa yang digunakan dalam audio Anda, pertimbangkanIdentifyLanguage untuk menggunakan untuk mengaktifkan identifikasi bahasa otomatis.

Untuk daftar bahasa yang didukung dengan Analytics Panggilan real-time, lihat tabel Bahasa yang didukung.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

Wajib: Ya

LanguageModelName

Tentukan nama model bahasa khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama model bahasa peka huruf besar atau kecil.

Bahasa model bahasa yang ditentukan harus sesuai dengan kode bahasa yang Anda tentukan dalam permintaan transkripsi Anda. Jika bahasa tidak cocok, model bahasa kustom tidak diterapkan. Tidak ada kesalahan atau peringatan yang terkait dengan ketidakcocokan bahasa.

Untuk informasi lebih lanjut, lihat Model bahasa kustom.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

MediaEncoding

Tentukan pengkodean audio input Anda. Format yang didukung adalah:

  • FLAC

  • Audio yang dikodekan oleh opus dalam wadah Ogg

  • PCM (hanya format audio 16-bit little-endian yang ditandatangani, yang tidak termasuk WAV)

Untuk informasi lebih lanjut, lihat Format media.

Nilai Valid: pcm | ogg-opus | flac

Wajib: Ya

MediaSampleRateHertz

Laju sampel audio input (dalam hertz). Audio berkualitas rendah, seperti audio telepon, biasanya sekitar 8.000 Hz. Audio berkualitas tinggi biasanya berkisar dari 16.000 Hz hingga 48.000 Hz. Perhatikan bahwa laju sampel yang Anda tentukan harus sesuai dengan audio Anda.

Rentang yang Valid: Nilai minimum 8000. Nilai maksimum 48000.

Wajib: Ya

PartialResultsStability

Tentukan tingkat stabilitas yang akan digunakan saat Anda mengaktifkan stabilisasi hasil sebagian (EnablePartialResultsStabilization).

Stabilitas rendah memberikan akurasi tertinggi. Stabilitas tinggi menyalin lebih cepat, tetapi dengan akurasi yang sedikit lebih rendah.

Untuk informasi lebih lanjut, lihat Stabilisasi hasil parsial.

Nilai Valid: high | medium | low

PiiEntityTypes

Tentukan tipe informasi pengenal pribadi (PII) yang ingin Anda edit di transkrip Anda. Anda dapat menyertakan sebanyak mungkin jenis yang Anda inginkan, atau Anda dapat memilihALL.

Untuk menyertakanPiiEntityTypes dalam permintaan Analytics Panggilan, Anda juga harus menyertakan salah satuContentIdentificationType atauContentRedactionType.

Nilai harus dipisahkan koma dan dapat mencakup:ADDRESS,,,BANK_ACCOUNT_NUMBER,BANK_ROUTING,CREDIT_DEBIT_CVV,CREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAIL,NAME,PHONE,PIN,SSN, atauALL.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 300.

Pola: ^[A-Z_, ]+

SessionId

Tentukan nama untuk sesi transkripsi Analytics Panggilan Anda. Jika Anda tidak menyertakan parameter ini dalam permintaan Anda, Amazon Transcribe akan menghasilkan ID dan mengembalikannya dalam respons.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Tentukan bagaimana Anda ingin filter kosakata Anda diterapkan pada transkrip Anda.

Untuk mengganti kata-kata dengan***, pilihmask.

Untuk menghapus kata, pilihremove.

Untuk menandai kata-kata tanpa mengubahnya, pilihtag.

Nilai Valid: remove | mask | tag

VocabularyFilterName

Tentukan nama filter kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama filter kosakata peka huruf besar atau kecil.

Jika bahasa filter kosakata kustom yang ditentukan tidak cocok dengan bahasa yang diidentifikasi di media Anda, filter kosakata tidak diterapkan ke transkripsi Anda.

Untuk informasi selengkapnya, lihat Menggunakan pemfilteran kosakata dengan kata-kata yang tidak diinginkan.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyName

Tentukan nama kosakata khusus yang ingin Anda gunakan saat memproses transkripsi Anda. Perhatikan bahwa nama kosakata peka huruf besar atau kecil.

Jika bahasa kosakata kustom yang ditentukan tidak cocok dengan bahasa yang diidentifikasi di media Anda, kosakata kustom tidak diterapkan pada transkripsi Anda.

Untuk informasi selengkapnya, lihat Kosakata khusus.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Isi Permintaan

Permintaan menerima data berikut dalam format JSON.

AudioStream

Aliran gumpalan audio yang dikodekan. Aliran audio dikodekan sebagai HTTP/2 atau bingkai WebSocket data.

Untuk informasi lebih lanjut, lihat Mentranskripsikan audio streaming.

Tipe: Objek CallAnalyticsAudioStream

Wajib: Ya

Sintaksis Respons

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "CallAnalyticsTranscriptResultStream": { "BadRequestException": { }, "CategoryEvent": { "MatchedCategories": [ "string" ], "MatchedDetails": { "string" : { "TimestampRanges": [ { "BeginOffsetMillis": number, "EndOffsetMillis": number } ] } } }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "UtteranceEvent": { "BeginOffsetMillis": number, "EndOffsetMillis": number, "Entities": [ { "BeginOffsetMillis": number, "Category": "string", "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Type": "string" } ], "IsPartial": boolean, "IssuesDetected": [ { "CharacterOffsets": { "Begin": number, "End": number } } ], "Items": [ { "BeginOffsetMillis": number, "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Stable": boolean, "Type": "string", "VocabularyFilterMatch": boolean } ], "ParticipantRole": "string", "Sentiment": "string", "Transcript": "string", "UtteranceId": "string" } } }

Elemen Respons

Jika tindakan berhasil, layanan mengirimkan kembali respons HTTP 200.

Respons mengembalikan header HTTP berikut.

ContentIdentificationType

Menampilkan apakah identifikasi konten diaktifkan untuk transkripsi Analytics Panggilan Anda.

Nilai Valid: PII

ContentRedactionType

Menunjukkan apakah redaksi konten diaktifkan untuk transkripsi Analytics Panggilan Anda.

Nilai Valid: PII

EnablePartialResultsStabilization

Menunjukkan apakah stabilisasi hasil sebagian diaktifkan untuk transkripsi Analytics Panggilan Anda.

LanguageCode

Menyediakan kode bahasa yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Nilai Valid: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

LanguageModelName

Menyediakan nama model bahasa kustom yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

MediaEncoding

Menyediakan pengkodean media yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Nilai Valid: pcm | ogg-opus | flac

MediaSampleRateHertz

Menyediakan laju sampel yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Rentang yang Valid: Nilai minimum 8000. Nilai maksimum 48000.

PartialResultsStability

Menyediakan tingkat stabilisasi yang digunakan untuk transkripsi Anda.

Nilai Valid: high | medium | low

PiiEntityTypes

Daftar jenis entitas PII yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 300.

Pola: ^[A-Z_, ]+

RequestId

Menyediakan pengenal untuk permintaan Analitik Panggilan real-time Anda.

SessionId

Menyediakan pengenal untuk sesi transkripsi Analytics Panggilan Anda.

Batas Panjang: Panjang tetap 36.

Pola: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Menyediakan metode penyaringan kosakata yang digunakan dalam transkripsi Call Analytics Anda.

Nilai Valid: remove | mask | tag

VocabularyFilterName

Menyediakan nama filter kosakata khusus yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

VocabularyName

Menyediakan nama kosakata kustom yang Anda tentukan dalam permintaan Analytics Panggilan Anda.

Batasan Panjang: Panjang minimum 1. Panjang maksimum 200.

Pola: ^[0-9a-zA-Z._-]+

Layanan mengembalikan data berikut dalam format JSON.

CallAnalyticsTranscriptResultStream

Memberikan informasi terperinci tentang sesi Analitik Panggilan real-time Anda.

Tipe: Objek CallAnalyticsTranscriptResultStream

Kesalahan

Untuk informasi tentang kesalahan yang umum untuk semua tindakan, lihat Kesalahan Umum.

BadRequestException

Satu atau lebih argumen untukStartStreamTranscriptionStartMedicalStreamTranscription,, atauStartCallAnalyticsStreamTranscription operasi tidak valid. Misalnya,MediaEncoding atauLanguageCode menggunakan nilai yang tidak didukung. Periksa parameter yang ditentukan dan coba permintaan Anda lagi.

Kode Status HTTP: 400

ConflictException

Aliran baru dimulai dengan ID sesi yang sama. Aliran saat ini telah dihentikan.

Kode Status HTTP: 409

InternalFailureException

Masalah terjadi saat memproses audio. Amazon Transcribe menghentikan pemrosesan.

Kode Status HTTP: 500

LimitExceededException

Klien Anda telah melampaui salah satu batas Amazon Transcribe. Ini biasanya batas panjang audio. Pecahkan aliran audio Anda menjadi potongan yang lebih kecil dan coba lagi permintaan Anda.

Kode Status HTTP: 429

ServiceUnavailableException

Layanan ini saat ini tidak tersedia. Coba permintaan Anda nanti.

Kode Status HTTP: 503

Lihat Juga

Untuk informasi lebih lanjut tentang penggunaan API ini di salah satu dariAWS SDK spesifik bahasa, lihat yang berikut ini: