語音標記輸出

焦點模式

語音標記輸出 - Amazon Polly

Amazon Polly 會在以行分隔的 JSON 串流中傳回語音標記物件。語音標記物件包含下列欄位：

時間 – 從對應的音訊串流開始的時間戳記 (以毫秒為單位)
類型 – 語音標記的類型（句子、單字、視覺效果或 ssml)
start – 輸入文字中物件開頭的位元組（而非字元）偏移（不包括視覺標記）
end – 物件結尾在輸入文字（不包括視覺標記）中的位元組（而非字元）偏移
值 – 這會根據語音標記的類型而異
- SSML：<mark> SSML 標籤
- 視素：視素名稱
- 文字或句子：輸入文字的子字串，由開始和結束欄位分隔

例如，Amazon Polly 會從「Mary has a little lamb」的文字產生下列word語音標記物件：


{"time":373,"type":"word","start":5,"end":8,"value":"had"}

所述文字 (「had」) 在音訊串流開始後 373 毫秒起始，並在輸入文字的位元組 5 開始位元組 8 結束。

此中繼資料是用於 Joannavoice-id。如果您使用另一個具相同輸入文字的語音，中繼資料可能不同。

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

Visemes 和 Amazon Polly

請求語音標記

選取您的 Cookie 偏好設定