請求語音標記 - Amazon Polly

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

請求語音標記

您可以使用 主控台或 synthesize-speech命令,從 Amazon Polly 請求語音標記。然後,您可以檢視中繼資料或將其儲存至檔案。

Console
在主控台上產生語音標記
  1. 登入 AWS Management Console 並在 開啟 Amazon Polly 主控台https://console.aws.amazon.com/polly/

  2. 選擇 Text-to-Speech (文字轉換語音) 索引標籤。

  3. 開啟 SSML 以使用 SSML。

  4. 輸入文字或將其貼到輸入方塊。

  5. 針對語言 ,選擇文字的語言。

  6. 針對語音 ,選擇您要使用的語音。

  7. 若要變更文字發音,請展開其他設定 ,開啟自訂發音 ,若要套用詞庫 ,請選擇所需的詞庫。

  8. 若要驗證語音,請選擇接聽

  9. 開啟語音檔案格式設定

    注意

    下載 MP3、 OGG或 PCM 格式不會產生語音標記。

  10. 針對檔案格式 ,選擇語音標記

  11. 對於語音標記類型 ,選擇要產生的語音標記類型。選擇SSML中繼資料的選項僅在SSML開啟時可用。如需SSML搭配 Amazon Polly 使用 的詳細資訊,請參閱 從SSML文件產生語音

  12. 選擇 Download (下載)。

AWS CLI

除了輸入文字之外,傳回此中繼資料需要下列元素:

  • output-format

    Amazon Polly 在傳回語音標記時僅支援 JSON 格式。

    --output-format json

    如果您使用不支援的輸出格式,Amazon Polly 會擲回例外狀況。

  • voice-id

    為確保中繼資料符合關聯的音訊串流,請指定相同的語音用來產生合成的語音音訊串流。可用的語音沒有相同的語音速率。如果您使用用於產生語音以外的聲音,中繼資料不會與音訊串流相符。

    --voice-id Joanna
  • speech-mark-types

    指定您想要的語音標記的類型。您可以請求任何或所有語音標記類型,但是必須至少指定一個類型。

    --speech-mark-types='["sentence", "word", "viseme", "ssml"]'
  • text-type

    純文字是 Amazon Polly 的預設輸入文字,因此text-type ssml如果您想要傳回SSML語音標記,則必須使用 。

  • outfile

    指定要寫入中繼資料的輸出檔案。

    MaryLamb.txt

下列 AWS CLI 範例已針對 Unix、Linux 和 macOS 格式化。對於 Windows,將每行結尾的反斜線 (\) Unix 連續字元取代為粗略 (^),並在輸入文字周圍使用完整引號 (") 取代內部標籤的單引號 (')。

aws polly synthesize-speech \ --output-format json \ --voice-id Voice ID \ --text 'Input text' \ --speech-mark-types='["sentence", "word", "viseme"]' \ outfile