View a markdown version of this page

割り込み - Amazon Nova

割り込み

割り込みを使用すると、ユーザーは自然な人間の会話と同様に、AI アシスタントの会話を中断できます。アシスタントが話し終わるのを待つ代わりに、ユーザーは新しい情報を割り込ませたり、前の発言を修正または明確にしたり、会話を別のトピックに移したり、十分聞いたと感じたらアシスタントを停止したりできます。これにより、より自然で応答性の高い会話体験が生まれます。

次の図は、割り込み会話フロー全体を示しています。

Amazon Nova 2 Sonic が割り込みを処理する方法

Amazon Nova 2 Sonic は、中断を適切に処理するように設計されています。ユーザーがレスポンス中に話し始めると、システムはすぐに現在のレスポンスの生成を停止し、完全な会話コンテキストを維持し、中断シグナルをクライアントに送信して、新しいユーザー入力を処理し始めます。

コンテキストの保存: 中断された場合でも、Nova Sonic は中断前に言ったこと、議論されているトピック、会話履歴、以前のターンからの関連するコンテキストを記憶します。これにより、会話が一貫性があり、自然な感じになります。

クライアント側の実装要件

Amazon Nova 2 Sonic はサーバー側で割り込みを処理しますが、完全なエクスペリエンスを実現するにはお客様がクライアント側のロジックを実装する必要があります。

オーディオキューチャレンジ: オーディオ生成が再生速度よりも高速です。つまり、次のようになります。

  • Nova Sonic はオーディオチャンクをすばやく生成します

  • クライアントがこれらのチャンクを受信してキューに入れます

  • クライアントが通常の話速度で再生します

  • 割り込みが発生すると、再生のためにすでにオーディオがキューに入れられています

必要なクライアント側のロジック: アプリケーションは次の 4 つの主要なステップを処理する必要があります:

  1. 中断シグナルを検出する: Nova Sonic からの中断イベントをリッスンし、受信後すぐに対応します。

  2. 現在の再生を停止する: 現在再生中のオーディオを一時停止し、再生中のオーディオをすべて停止します。

  3. オーディオキューをクリアする: キューに入れられたすべてのオーディオチャンクを削除し、バッファされたオーディオを中断されたレスポンスから破棄します。

  4. 新しいオーディオを開始する: 新しく受信したオーディオの再生を開始し、通常の再生フローを再開します。