長いオーディオファイル - Amazon Polly

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

長いオーディオファイル

テキストの大きなパス用のTTSファイルを作成するには、Amazon Polly の非同期合成機能を使用します。これにより、次の 3 SpeechSynthesisTask つの が使用されますAPIs。

  • StartSpeechSynthesisTask: 新しい合成タスクを開始します。

  • GetSpeechSynthesisTask: 以前に送信された合成タスクの詳細を返します。

  • ListSpeechSynthesisTasks: 送信された合成タスクを一覧表示します。

SynthesizeSpeech オペレーションはほぼリアルタイムにオーディオを生成し、ほとんどの場合、レイテンシーは比較的わずかです。これを行う場合、このオペレーションで合成できるのは 3000 文字だけです。

Amazon Polly の非同期の合成機能は、ドキュメントが合成され返される方法を変更することにより、より大きなテキストドキュメントを処理するという課題を克服します。StartSpeechSynthesisTask を使用して入力テキストを送信することにより合成リクエストが行われた場合、Amazon Polly ではリクエストがキューに入れられ、システムリソースが利用可能になるとすぐに非同期で処理されます。その後、Amazon Polly は、結果として生成された音声または音声マークストリームを (必須) Amazon Simple Storage Service (Amazon S3) バケットに直接アップロードし、完了したファイルの可用性を (オプション) SNSトピックを通じて通知します。

このようにして、ほぼリアルタイムの処理を除くすべての機能で利用できる長さは、最大で請求可能な 100,000 文字 (または合計 200,000 文字) です。

このメソッドを使用してドキュメントを合成するには、オーディオファイルを保存できる書き込み可能な Amazon S3 バケットを用意する必要があります。合成されたオーディオの準備ができたら、オプションのSNSトピック識別子を指定して通知を受け取ることができます。合成タスクが完了すると、Amazon Polly は、そのトピックにメッセージを発行します。合成タスクが成功しなかった場合、このメッセージには役立つエラー情報が含まれていることもあります。これを行うには、合成タスクを作成するユーザーがSNSトピックに発行できることを確認してください。SNS トピックを作成してサブスクライブする方法の詳細については、Amazon SNSドキュメントを参照してください。

暗号化

必要に応じて出力ファイルを暗号化された形式で S3 バケットに保存できます。これを行うには、Amazon S3 バケット暗号化 を有効にします。これは、利用可能な最も強力なブロック暗号の 1 つである 256 ビットの Advanced Encryption Standard (AES-256) を使用します。