本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
請求語音標記
您可以使用 主控台或 synthesize-speech
命令,從 Amazon Polly 請求語音標記。然後,您可以檢視中繼資料或將其儲存至檔案。
- Console
-
在主控台上產生語音標記
登入 AWS Management Console 並在 開啟 Amazon Polly 主控台https://console.aws.amazon.com/polly/
。 -
選擇 Text-to-Speech (文字轉換語音) 索引標籤。
-
開啟 SSML 以使用 SSML。
-
輸入文字或將其貼到輸入方塊。
-
針對語言 ,選擇文字的語言。
-
針對語音 ,選擇您要使用的語音。
-
若要變更文字發音,請展開其他設定 ,開啟自訂發音 ,若要套用詞庫 ,請選擇所需的詞庫。
-
若要驗證語音,請選擇接聽 。
-
開啟語音檔案格式設定 。
注意
下載 MP3、 OGG或 PCM 格式不會產生語音標記。
-
針對檔案格式 ,選擇語音標記 。
-
對於語音標記類型 ,選擇要產生的語音標記類型。選擇SSML中繼資料的選項僅在SSML開啟時可用。如需SSML搭配 Amazon Polly 使用 的詳細資訊,請參閱 從SSML文件產生語音。
-
選擇 Download (下載)。
- AWS CLI
-
除了輸入文字之外,傳回此中繼資料需要下列元素:
-
output-format
Amazon Polly 在傳回語音標記時僅支援 JSON 格式。
--output-format json
如果您使用不支援的輸出格式,Amazon Polly 會擲回例外狀況。
-
voice-id
為確保中繼資料符合關聯的音訊串流,請指定相同的語音用來產生合成的語音音訊串流。可用的語音沒有相同的語音速率。如果您使用用於產生語音以外的聲音,中繼資料不會與音訊串流相符。
--voice-id Joanna
-
speech-mark-types
指定您想要的語音標記的類型。您可以請求任何或所有語音標記類型,但是必須至少指定一個類型。
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
-
text-type
純文字是 Amazon Polly 的預設輸入文字,因此
text-type ssml
如果您想要傳回SSML語音標記,則必須使用 。 -
outfile
指定要寫入中繼資料的輸出檔案。
MaryLamb.txt
下列 AWS CLI 範例已針對 Unix、Linux 和 macOS 格式化。對於 Windows,將每行結尾的反斜線 (\) Unix 連續字元取代為粗略 (^),並在輸入文字周圍使用完整引號 (") 取代內部標籤的單引號 (')。
aws polly synthesize-speech \ --output-format json \ --voice-id
Voice ID
\ --text 'Input text
' \ --speech-mark-types='["sentence", "word", "viseme"]' \outfile
-