Membuat file audio yang panjang - Amazon Polly

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat file audio yang panjang

Anda dapat menggunakan konsol Amazon Polly untuk membuat pidato panjang menggunakan sintesis asinkron dengan fungsionalitas yang sama seperti yang dapat Anda gunakan dengan. AWS CLI Ini dilakukan dengan menggunakan tab Text-to-Speech seperti sintesis lainnya.

Console

Fungsi sintesis asinkron lainnya juga tersedia melalui konsol. Tab tugas sintesis S3 mencerminkan ListSpeechSynthesisTasks fungsionalitas, menampilkan semua tugas yang disimpan ke bucket S3 dan memungkinkan Anda untuk memfilternya jika Anda mau. Mengklik pada satu tugas tertentu menunjukkan detailnya, mencerminkan GetSpeechSynthesisTask fungsionalitas.

Untuk mensintesis teks besar menggunakan konsol Amazon Polly
  1. Masuk ke AWS Management Console dan buka konsol Amazon Polly di. https://console.aws.amazon.com/polly/

  2. Pilih tab Text-to-Speech. Pilih Formulir Panjang sebagai mesin jika sesuai.

  3. Dengan SSMLhidup atau mati, ketik atau tempel teks Anda ke dalam kotak input.

  4. Pilih bahasa, wilayah, dan suara untuk teks Anda.

  5. Pilih Simpan ke S3.

    catatan

    Opsi Unduh dan Dengarkan berwarna abu-abu jika panjang teks di atas batas 3.000 karakter untuk SynthesizeSpeech operasi waktu nyata.

  6. Konsol membuka formulir sehingga Anda dapat memilih tempat menyimpan file output.

    1. Isi nama bucket Amazon S3 tujuan.

    2. Secara opsional, isi kunci awalan output.

      catatan

      Bucket output S3 harus dapat ditulis.

    3. Jika Anda ingin diberi tahu saat tugas sintesis selesai, berikan pengenal SNS topik opsional.

      catatan

      SNSHarus terbuka untuk publikasi oleh pengguna konsol saat ini untuk menggunakan opsi ini. Untuk informasi selengkapnya, lihat Amazon Simple Notification Service (SNS)

    4. Pilih Simpan ke S3.

Untuk mengambil informasi tentang tugas sintesis ucapan Anda
  1. Di konsol, pilih tab S3 Synthesis Tasks.

  2. Tugas ditampilkan dalam urutan tanggal. Untuk memfilter tugas, berdasarkan status, pilih Semua status dan kemudian pilih status yang akan digunakan.

  3. Untuk melihat detail tugas tertentu, pilih ID Tugas yang ditautkan.

AWS CLI

Fungsionalitas sintesis asinkron Amazon Polly menggunakan tiga SpeechSynthesisTask APIs untuk bekerja dengan sejumlah besar teks:

  • StartSpeechSynthesisTask: memulai tugas sintesis baru.

  • GetSpeechSynthesisTask: mengembalikan rincian tentang tugas sintesis yang dikirimkan sebelumnya.

  • ListSpeechSynthesisTasks: mencantumkan semua tugas sintesis yang dikirimkan.

Mensintesis sejumlah besar teks () StartSpeechSynthesisTask

Saat Anda ingin membuat file audio yang lebih besar dari yang dapat Anda buat dengan waktu nyataSynthesizeSpeech, gunakan StartSpeechSynthesisTask operasi. Selain argumen yang diperlukan untuk SynthesizeSpeech operasi, StartSpeechSynthesisTask juga memerlukan nama bucket Amazon S3. Dua argumen opsional lainnya juga tersedia: key prefix untuk file output dan ARN untuk SNS Topic jika Anda ingin menerima pemberitahuan status tentang tugas.

  • OutputS3BucketName: Nama bucket Amazon S3 tempat sintesis harus diunggah. Bucket ini harus berada di wilayah yang sama dengan layanan Amazon Polly. Selain itu, IAM pengguna yang digunakan untuk melakukan panggilan harus memiliki akses ke bucket. [Diperlukan]

  • OutputS3KeyPrefix: Awalan kunci untuk file output. Gunakan parameter ini jika Anda ingin menyimpan file ucapan keluaran dalam kunci seperti direktori khusus di bucket Anda. [Opsional]

  • SnsTopicArn: SNS Topik ARN yang akan digunakan jika Anda ingin menerima pemberitahuan tentang status tugas. SNSTopik ini harus berada di wilayah yang sama dengan layanan Amazon Polly. Selain itu, IAM pengguna yang digunakan untuk melakukan panggilan harus memiliki akses ke topik. [Opsional]

Misalnya, contoh berikut dapat digunakan untuk menjalankan start-speech-synthesis-task AWS CLI perintah di wilayah AS Timur (Ohio):

AWS CLI Contoh berikut diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^) dan gunakan tanda kutip penuh (“) di sekitar teks input dengan tanda kutip tunggal (') untuk tag interior.

aws polly start-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https://polly.us-east-2.amazonaws.com/" \ --output-format mp3 \ --output-s3-bucket-name your-bucket-name \ --output-s3-key-prefix optional/prefix/path/file \ --voice-id Joanna \ --text file://text_file.txt

Ini akan menghasilkan respons yang terlihat mirip dengan ini:

"SynthesisTask": { "OutputFormat": "mp3", "OutputUri": "https://s3.us-east-2.amazonaws.com/your-bucket-name/optional/prefix/path/file.<task_id>.mp3", "TextType": "text", "CreationTime": [..], "RequestCharacters": [..], "TaskStatus": "scheduled", "TaskId": [task_id], "VoiceId": "Joanna" }

start-speech-synthesis-taskOperasi mengembalikan beberapa bidang baru:

  • OutputUri: lokasi file ucapan keluaran Anda.

  • TaskId: pengidentifikasi unik untuk tugas sintesis ucapan yang dihasilkan oleh Amazon Polly.

  • CreationTime: stempel waktu saat tugas awalnya dikirimkan.

  • RequestCharacters: jumlah karakter yang dapat ditagih dalam tugas.

  • TaskStatus: memberikan informasi tentang status tugas yang diajukan.

    Ketika tugas Anda dikirimkan, status awal akan ditampilkanscheduled. Saat Amazon Polly mulai memproses tugas, status akan berubah menjadi inProgress dan lebih baru, menjadi completed atau. failed Jika tugas gagal, pesan kesalahan akan dikembalikan saat memanggil GetSpeechSynthesisTask atau ListSpeechSynthesisTasks operasi.

Ketika tugas selesai, file ucapan tersedia di lokasi yang ditentukan dalamOutputUri.

Mengambil informasi tentang tugas sintesis ucapan Anda

Anda bisa mendapatkan informasi tentang tugas, seperti kesalahan, status, dan sebagainya, menggunakan GetSpeechSynthesisTask operasi. Untuk melakukan ini, Anda perlu task-id dikembalikan olehStartSpeechSynthesisTask.

Misalnya, contoh berikut dapat digunakan untuk menjalankan get-speech-synthesis-task AWS CLI perintah:

aws polly get-speech-synthesis-task \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/" \ --task-id task identifier

Anda juga dapat mencantumkan semua tugas sintesis ucapan yang telah Anda jalankan di wilayah saat ini menggunakan ListSpeechSynthesisTasks operasi.

Misalnya, contoh berikut dapat digunakan untuk menjalankan list-speech-synthesis-tasks AWS CLI perintah:

aws polly list-speech-synthesis-tasks \ --region us-east-2 \ --endpoint-url "https:// polly.us-east-2.amazonaws.com/"