イベントフローシーケンス
一般的な会話は次のイベントシーケンスに従います。
-
セッション開始 – 会話セッションを開始する
-
システムプロンプト – システム指示を送信する
-
チャット履歴 (オプション) – 会話コンテキストを提供する
-
オーディオチャンク – ユーザーオーディオ入力をストリーミングする
-
完了開始 – AI が処理を開始する
-
ASR トランスクリプト (ユーザー) – ユーザー音声文字起こし
-
ツールの使用 (オプション) – AI がツールの実行をリクエスト
-
ツール処理 (オプション) – ツール結果を処理して返す
-
トランスクリプト (アシスタント) – 投機的 – 予備 AI レスポンス
-
オーディオチャンク – AI オーディオ出力をストリーミングする
-
トランスクリプト (アシスタント) – 最終 – 最終 AI レスポンストランスクリプト
-
コンテンツ終了オーディオ – オーディオコンテンツの終了をマークする
-
Prompt End – プロンプト処理の完了を示す
-
セッション終了 – 会話を閉じる