本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
長音訊檔案
若要為大量文字段落建立 TTS 檔案,請使用 Amazon Polly 的非同步合成功能。這會用到三個 SpeechSynthesisTask
API:
-
StartSpeechSynthesisTask
:開始執行新的合成作業。 -
GetSpeechSynthesisTask
:針對先前提交的合成作業傳回詳細資訊。 -
ListSpeechSynthesisTasks
:列出所有已提交的合成作業。
SynthesizeSpeech
作業會以近乎即時速度產生音訊,而且在大多數情況中的延遲相當少。為了實現此種效能,這項作業只能合成 3000 個字元。
Amazon Polly 的非同步合成功能透過變更文件合成和傳回的方式,克服處理較大文字文件的挑戰。使用 提交輸入文字提出合成請求時StartSpeechSynthesisTask
,Amazon Polly 會將請求排入佇列,然後在系統資源可用時立即在背景中以非同步方式處理這些請求。然後,Amazon Polly 會將產生的語音或語音標記串流直接上傳至您的 (必要) Amazon Simple Storage Service (Amazon S3) 儲存貯體,並透過 (選用) SNS 主題通知您已完成檔案的可用性。
利用這種方式,長度最多包含 100,000 個應計費字元 (或總計 200,000 個字元) 的文字,即可使用除了近乎即時處理以外的所有功能。
若要使用此方法合成文件,您必須擁有可寫入的 Amazon S3 儲存貯體,才能儲存音訊檔案。藉由提供選用的 SNS 主題識別符,您可以在合成音訊準備完成時收到通知。當合成任務完成時,Amazon Polly 將發佈該主題的訊息。此訊息也可能包含有用的錯誤資訊,這些資訊會在合成作業失敗時顯示。若要這麼做,請確定建立合成作業的使用者,也可以發佈到 SNS 主題。關於建立和訂閱 SNS 主題的方法,詳細資訊請參閱 Amazon SNS 文件。
加密
您可以根據需要,將加密的輸出檔案儲存於 S3 儲存貯體中。若要這麼做,您可以啟用 Amazon S3 儲存貯體加密,這項功能使用目前最強大的其中一種區塊加密法 (256 位元進階加密標準 (AES-256))。