View a markdown version of this page

闖入 - Amazon Nova

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

闖入

插斷功能可讓使用者在說話時中斷 AI 助理,就像自然人對話一樣。使用者可以插入新資訊、更正或釐清先前的陳述式、將對話重新導向至不同的主題,或在聽到足夠的訊息時直接停止助理,而不是等待助理完成。這可建立更自然且回應靈敏的對話體驗。

下圖說明完整的插斷對話流程:

顯示使用者中斷、音訊佇列清除和產生新回應的插入流程。

Amazon Nova 2 Sonic 如何處理插入

Amazon Nova 2 Sonic 旨在正常處理中斷。當使用者在回應期間開始說話時,系統會立即停止產生目前的回應、維護完整的對話內容、傳送中斷訊號給用戶端,並開始處理新的使用者輸入。

內容保留:即使中斷,Nova Sonic 仍會記住中斷前所說的內容、討論的主題、對話歷史記錄,以及先前回合的任何相關內容。這可確保對話的一致性和自然性。

用戶端實作需求

雖然 Amazon Nova 2 Sonic 在伺服器端處理插斷,但您需要實作用戶端邏輯以獲得完整的體驗。

音訊佇列挑戰:音訊產生速度比播放速度快。這表示:

  • Nova Sonic 快速產生音訊區塊

  • 您的用戶端會接收這些區塊並將其排入佇列

  • 用戶端會以正常說話速度播放

  • 發生插斷時,已將音訊排入佇列以供播放

必要的用戶端邏輯:您的應用程式必須處理四個關鍵步驟:

  1. 偵測中斷訊號:接聽來自 Nova Sonic 的中斷事件,並在收到時立即做出反應。

  2. 停止目前播放:暫停目前播放的音訊,並停止任何中間播放的音訊。

  3. 清除音訊佇列:移除所有排入佇列的音訊區塊,並從中斷的回應中捨棄任何緩衝的音訊。

  4. 開始新音訊:開始播放新接收的音訊,並繼續正常播放流程。