選取您的 Cookie 偏好設定

我們使用提供自身網站和服務所需的基本 Cookie 和類似工具。我們使用效能 Cookie 收集匿名統計資料,以便了解客戶如何使用我們的網站並進行改進。基本 Cookie 無法停用,但可以按一下「自訂」或「拒絕」以拒絕效能 Cookie。

如果您同意,AWS 與經核准的第三方也會使用 Cookie 提供實用的網站功能、記住您的偏好設定,並顯示相關內容,包括相關廣告。若要接受或拒絕所有非必要 Cookie,請按一下「接受」或「拒絕」。若要進行更詳細的選擇,請按一下「自訂」。

語音標記輸出

焦點模式
語音標記輸出 - Amazon Polly

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Amazon Polly 會在以行分隔的 JSON 串流中傳回語音標記物件。語音標記物件包含下列欄位:

  • 時間 – 從對應的音訊串流開始的時間戳記 (以毫秒為單位)

  • 類型 – 語音標記的類型 (句子、單字、視覺效果或 ssml)

  • start – 輸入文字中物件開頭的位元組 (而非字元) 偏移 (不包括視覺標記)

  • end – 物件結尾在輸入文字 (不包括視覺標記) 中的位元組 (而非字元) 偏移

  • – 這會根據語音標記的類型而異

    • SSML:<mark> SSML 標籤

    • 視素:視素名稱

    • 文字句子:輸入文字的子字串,由開始和結束欄位分隔

例如,Amazon Polly 會從「Mary has a little lamb」的文字產生下列word語音標記物件:

{"time":373,"type":"word","start":5,"end":8,"value":"had"}

所述文字 (「had」) 在音訊串流開始後 373 毫秒起始,並在輸入文字的位元組 5 開始位元組 8 結束。

注意

此中繼資料是用於 Joannavoice-id。如果您使用另一個具相同輸入文字的語音,中繼資料可能不同。

隱私權網站條款Cookie 偏好設定
© 2025, Amazon Web Services, Inc.或其附屬公司。保留所有權利。