Sequência de fluxo de eventos
Uma conversa típica segue esta sequência de eventos:
-
Início da sessão: inicializa a sessão de conversação
-
Prompt do sistema: envia instruções do sistema
-
Histórico do bate-papo (opcional): fornece o contexto da conversa
-
Segmentos de áudio: transmite a entrada de áudio do usuário por streaming
-
Início da conclusão: a IA inicia o processamento
-
Transcrições de ASR (USER): transcrição da fala do usuário
-
Uso da ferramenta (opcional): a IA solicita a execução da ferramenta
-
Manuseio de ferramentas (opcional): processa e devolve resultados da ferramenta
-
Transcrição (ASSISTANT) - SPECULATIVE: resposta preliminar da IA
-
Segmentos de áudio: transmite a saída de áudio da IA por streaming
-
Transcrição (ASSISTANT) - FINAL: transcrição final da resposta da IA
-
Áudio final do conteúdo: marca o fim do conteúdo de áudio
-
Término do prompt: indica a conclusão do processamento do prompt
-
Término da sessão: conclui a conversa