Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Mentranskripsikan audio streaming
Dengan menggunakan Amazon Transcribe streaming, Anda dapat menghasilkan transkripsi waktu nyata untuk konten media Anda. Tidak seperti transkripsi batch, yang melibatkan pengunggahan file media, media streaming dikirimkan Amazon Transcribe secara real time. Amazon Transcribe kemudian mengembalikan transkrip, juga secara real time.
Streaming dapat mencakup media pra-rekaman (film, musik, dan podcast) dan media real-time (siaran berita langsung). Kasus penggunaan streaming umum Amazon Transcribe termasuk teks tertutup langsung untuk acara olahraga dan pemantauan audio call center secara real-time.
Konten streaming dikirimkan sebagai serangkaian paket data berurutan, atau 'potongan', yang mentranskripsikan secara instan. Amazon Transcribe Keuntungan menggunakan streaming melalui batch termasuk speech-to-text kemampuan real-time dalam aplikasi Anda dan waktu transkripsi yang lebih cepat. Namun, peningkatan kecepatan ini mungkin memiliki keterbatasan akurasi dalam beberapa kasus.
Amazon Transcribe menawarkan opsi berikut untuk streaming:
-
SDKs(lebih disukai)
Untuk mentranskripsikan audio streaming di AWS Management Console, bicaralah ke mikrofon komputer Anda.
Tip
Untuk contoh SDK kode, lihat repositori AWS Sampel
Format audio yang didukung untuk transkripsi streaming adalah:
FLAC
OPUS-audio yang dikodekan dalam wadah Ogg
PCM(hanya menandatangani format audio kecil endian 16-bit, yang tidak termasuk) WAV
Format lossless (FLACatauPCM) direkomendasikan.
catatan
Transkripsi streaming tidak didukung dengan semua bahasa. Lihat kolom 'Input data' dalam tabel bahasa yang didukung untuk detailnya.
Untuk melihat ketersediaan Amazon Transcribe Wilayah untuk transkripsi streaming, lihat: Amazon Transcribe Titik Akhir dan Kuota.
Praktik terbaik
Rekomendasi berikut meningkatkan efisiensi transkripsi streaming:
-
Jika memungkinkan, gunakan audio PCM -encoded.
-
Pastikan streaming Anda sedekat mungkin dengan waktu nyata.
-
Latensi tergantung pada ukuran potongan audio Anda. Jika Anda dapat menentukan ukuran potongan dengan jenis audio Anda (seperti denganPCM), atur setiap potongan menjadi antara 50 ms dan 200 ms. Anda dapat menghitung ukuran potongan audio dengan rumus berikut:
chunk_size_in_bytes = chunk_duration_in_millisecond / 1000 * audio_sample_rate * 2
-
Gunakan ukuran potongan yang seragam.
-
Pastikan Anda menentukan jumlah saluran audio dengan benar.
-
Dengan PCM audio saluran tunggal, setiap sampel terdiri dari dua byte, sehingga setiap potongan harus terdiri dari jumlah byte genap.
-
Dengan PCM audio saluran ganda, setiap sampel terdiri dari empat byte, sehingga setiap potongan harus kelipatan 4 byte.
-
Ketika streaming audio Anda tidak berisi ucapan, encode dan kirim jumlah keheningan yang sama. Misalnya, diam untuk PCM adalah aliran nol byte.
-
Pastikan Anda menentukan laju pengambilan sampel yang benar untuk audio Anda. Jika memungkinkan, rekam pada laju pengambilan sampel 16.000 Hz; ini memberikan kompromi terbaik antara kualitas dan volume data yang dikirim melalui jaringan. Perhatikan bahwa sebagian besar mikrofon kelas atas merekam pada 44.100 Hz atau 48.000 Hz.