本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
語音標記類型
您可以使用 SynthesizeSpeech或 StartSpeechSynthesisTask命令SpeechMarkTypes的選項來請求語音標記。您指定要從您的輸入文字傳回的中繼資料元素。您可以請求最多四種類型的中繼資料,但是每個請求必須至少指定一個。請求不會產生任何音訊輸出。
在 中 AWS CLI,例如:
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
Amazon Polly 使用以下元素產生語音標記:
-
句子 – 表示輸入文字中的句子元素。
-
字詞 – 表示文字中的字詞元素。
-
viseme – 描述對應於所說話之每個電話的臉和嘴巴動作。如需詳細資訊,請參閱Visemes 和 Amazon Polly。
-
ssml – 從SSML輸入文字描述 <mark> 元素。如需詳細資訊,請參閱從SSML文件產生語音。