本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
闖入
插斷功能可讓使用者在說話時中斷 AI 助理,就像自然人對話一樣。使用者可以插入新資訊、更正或釐清先前的陳述式、將對話重新導向至不同的主題,或在聽到足夠的訊息時直接停止助理,而不是等待助理完成。這可建立更自然且回應靈敏的對話體驗。
下圖說明完整的插斷對話流程:
Amazon Nova 2 Sonic 如何處理插入
Amazon Nova 2 Sonic 旨在正常處理中斷。當使用者在回應期間開始說話時,系統會立即停止產生目前的回應、維護完整的對話內容、傳送中斷訊號給用戶端,並開始處理新的使用者輸入。
內容保留:即使中斷,Nova Sonic 仍會記住中斷前所說的內容、討論的主題、對話歷史記錄,以及先前回合的任何相關內容。這可確保對話的一致性和自然性。
用戶端實作需求
雖然 Amazon Nova 2 Sonic 在伺服器端處理插斷,但您需要實作用戶端邏輯以獲得完整的體驗。
音訊佇列挑戰:音訊產生速度比播放速度快。這表示:
-
Nova Sonic 快速產生音訊區塊
-
您的用戶端會接收這些區塊並將其排入佇列
-
用戶端會以正常說話速度播放
-
發生插斷時,已將音訊排入佇列以供播放
必要的用戶端邏輯:您的應用程式必須處理四個關鍵步驟:
-
偵測中斷訊號:接聽來自 Nova Sonic 的中斷事件,並在收到時立即做出反應。
-
停止目前播放:暫停目前播放的音訊,並停止任何中間播放的音訊。
-
清除音訊佇列:移除所有排入佇列的音訊區塊,並從中斷的回應中捨棄任何緩衝的音訊。
-
開始新音訊:開始播放新接收的音訊,並繼續正常播放流程。