選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

長形語音

焦點模式
長形語音 - Amazon Polly

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Polly 具有長形引擎,可產生類似人類、高度表達和情緒熟練的聲音。長格式語音旨在吸引聆聽者注意較長的內容,例如新聞文章、培訓資料或行銷影片。

Amazon Polly Long-form 語音是使用尖端深度學習 TTS 技術開發而成。此模型會學習複寫人類語言的音素、音素、音調和其他音素和聲音層面,進而產生高度自然的語音輸出。

長形引擎使用文字內嵌來解譯文字的意義。使用文字內嵌,長形引擎可以產生自然聲音的正確強調、暫停和色調。結果是結合存在於人類溝通中完整範圍的情緒元素的語音。這包括模仿出乎意料或區分對話與敘述。這樣一來,就能建立聽起來像人類的高級語音產品。

注意

這些語音的state-of-the-art技術位於生成式 AI 的範本中,適用於語言和語音建模。技術的副作用是,訓練資料和模型的任何更新都可能導致聲音聲音的音量稍微變化,即使整體品質隨著模型更新而改善。這可能會影響長時間合成不同內容部分的使用案例,例如播客季節。

可用的長格式語音

Amazon Polly 目前提供四個 en-US 和兩個 es-ES 長格式語音。兩種語言都有提供母語和男性語音。英文的長語也可以在對話式 NTTS 變體中使用:Daniel、Gregory 和 Ruth。

語言 語言代碼 名稱/ID Gender

1

英文 (美國)

zh-TW

丹尼爾文

Gregory

Ruth

派翠克

女性

男性

女性

男性

2

西班牙文 (西班牙)

es-ES

Alba

Raúl

女性

男性

功能和區域相容性

Amazon Polly 長格式語音可在下列區域使用:

  • 美國東部 (維吉尼亞北部):us-east-1

  • 其他區域無法使用

Amazon Polly Long-form 引擎支援下列功能:

  • 即時和非同步語音合成操作。

  • 所有語音標記

  • Amazon Polly 支援許多 (但非全部) SSML 標籤。如需 NTTS 支援的 SSML 標籤的詳細資訊,請參閱支援的 SSML 標籤

  • 如同標準語音,您可以從各種取樣率中選擇,為您的應用程式最佳化頻寬和音訊品質。標準語音、長格式語音和神經語音的有效取樣率為:8 kHz、16 kHz、22kHz 或 24 kHz。標準語音的預設值為 22 kHz。長格式和神經語音的預設值為 24 kHz。Amazon Polly 支援 MP3、OGG (Vorbis) 和原始 PCM 音訊串流格式。

注意

長格式語音成本會在 Amazon Polly 定價資訊頁面上指定。

下一個主題:

神經引擎

上一個主題:

生成式引擎

在本頁面

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。