Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Come funziona Amazon Bedrock Agents
Amazon Bedrock Agents comprende i seguenti due set principali di API operazioni per aiutarti a configurare ed eseguire un agente:
-
APIOperazioni in fase di sviluppo per creare, configurare e gestire i tuoi agenti e le relative risorse
-
APIOperazioni di runtime per richiamare l'agente con l'input dell'utente e avviare l'orchestrazione per eseguire un'attività.
Configurazione in fase di compilazione
Un agente è costituito dai componenti seguenti:
-
Modello di base: si sceglie un modello di base (FM) che l'agente richiama per interpretare l'input dell'utente e le istruzioni successive nel processo di orchestrazione. L'agente richiama inoltre l'FM per generare risposte e fasi successive del processo.
-
Istruzioni: scrivi istruzioni che descrivono ciò per cui l'agente è progettato. Con i prompt avanzati, puoi personalizzare ulteriormente le istruzioni per l'agente in ogni fase dell'orchestrazione e includere funzioni Lambda per analizzare l'output di ogni fase.
-
Almeno uno dei seguenti:
-
Gruppi di azioni: si definiscono le azioni che l'agente deve eseguire per l'utente (fornendo le seguenti risorse):
-
Uno dei seguenti schemi per definire i parametri che l'agente deve ottenere dall'utente (ogni gruppo di azioni può utilizzare uno schema diverso):
-
Un record OpenAPI schema per definire API le operazioni che l'agente può richiamare per eseguire le proprie attività. Il OpenAPI lo schema include i parametri che devono essere richiamati dall'utente.
-
Uno schema dettagliato delle funzioni per definire i parametri che l'agente può richiedere all'utente. Questi parametri possono quindi essere utilizzati per un'ulteriore orchestrazione da parte dell'agente oppure è possibile impostare come utilizzarli nella propria applicazione.
-
-
(Opzionale) Una funzione Lambda con i seguenti input e output:
-
Input: l'APIoperazione e/o i parametri identificati durante l'orchestrazione.
-
Output: la risposta dall'APIinvocazione .
-
-
-
Basi di conoscenza: associa le basi di conoscenza a un agente. L'agente interroga la Knowledge Base per ottenere ulteriori informazioni in modo da aumentare la generazione di risposte e l'input nelle fasi del processo di orchestrazione.
-
-
Modelli di prompt: i modelli di prompt sono la base per la creazione di prompt da fornire all'FM. Amazon Bedrock Agents espone i quattro modelli di prompt di base predefiniti utilizzati durante la pre-elaborazione, l'orchestrazione, la generazione di risposte della knowledge base e la post-elaborazione. Facoltativamente, puoi modificare questi modelli di prompt di base per personalizzare il comportamento dell'agente in ogni fase della sequenza. Puoi anche disattivare i passaggi per la risoluzione dei problemi o se ritieni che un passaggio non sia necessario. Per ulteriori informazioni, consulta Migliora la precisione degli agenti utilizzando modelli di prompt avanzati in Amazon Bedrock.
In fase di compilazione, tutti questi componenti vengono raccolti per creare istruzioni di base affinché l'agente esegua l'orchestrazione fino al completamento della richiesta dell'utente. Con i prompt avanzati, puoi modificare questi prompt di base con logica aggiuntiva ed esempi con poche informazioni per migliorare la precisione di ogni passaggio dell'invocazione dell'agente. I modelli di prompt di base contengono istruzioni, descrizioni delle azioni, descrizioni della knowledge base e cronologia delle conversazioni, tutte personalizzabili per modificare l'agente in base alle proprie esigenze. Quindi preparate l'agente, che impacchetta tutti i componenti degli agenti, comprese le configurazioni di sicurezza. La preparazione dell'agente lo porta in uno stato in cui può essere testato in fase di esecuzione. L'immagine seguente mostra come le API operazioni in fase di compilazione costruiscono l'agente.
Processo di runtime
Il runtime è gestito da InvokeAgentAPIoperazione. Questa operazione avvia la sequenza degli agenti, che consiste nei tre passaggi principali seguenti.
-
Preelaborazione: gestisce il modo in cui l'agente contestualizza e classifica l'input dell'utente e può essere utilizzato per convalidare l'input.
-
Orchestrazione: interpreta l'input dell'utente, richiama gruppi di azioni e interroga le knowledge base e restituisce l'output all'utente o come input per un'orchestrazione continua. L'orchestrazione consiste nei seguenti passaggi:
-
L'agente interpreta l'input con un modello di fondazione e genera una logica per il passaggio successivo da intraprendere.
-
L'agente prevede quale azione in un gruppo di azioni deve invocare o su quale knowledge base deve interrogare.
-
Se l'agente prevede di dover richiamare un'azione, invia i parametri, determinati dal prompt dell'utente, alla funzione Lambda configurata per il gruppo di azioni o restituisce il controllo inviando i parametri nel InvokeAgentrisposta. Se l'agente non dispone di informazioni sufficienti per richiamare l'azione, potrebbe eseguire una delle seguenti azioni:
-
Interroga una knowledge base associata (Knowledge base response generation) per recuperare un contesto aggiuntivo e riepilogare i dati per aumentarne la generazione.
-
Richiede nuovamente all'utente di raccogliere tutti i parametri richiesti per l'azione.
-
-
L'agente genera un output, noto come osservazione, dall'invocazione di un'azione e/o dal riepilogo dei risultati di una knowledge base. L'agente utilizza l'osservazione per aumentare il prompt di base, che viene poi interpretato con un modello di fondazione. L'agente determina quindi se è necessario reiterare il processo di orchestrazione.
-
Questo ciclo continua finché l'agente non restituisce una risposta all'utente o finché non è necessario richiedere all'utente ulteriori informazioni.
Durante l'orchestrazione, il modello di prompt di base viene arricchito con le istruzioni dell'agente, i gruppi di azioni e le knowledge base che avete aggiunto all'agente. Quindi, l'augmented base prompt viene utilizzato per richiamare la FM. L'FM prevede i passi e la traiettoria migliori possibili per soddisfare l'input dell'utente. Ad ogni iterazione dell'orchestrazione, la FM prevede l'APIoperazione da richiamare o la base di conoscenza da interrogare.
-
-
Postelaborazione: l'agente formatta la risposta finale per restituirla all'utente. Per impostazione predefinita, questo passaggio è disabilitato.
Quando richiami il tuo agente, puoi attivare una traccia in fase di esecuzione. Con la traccia, puoi tenere traccia delle motivazioni, delle azioni, delle domande e delle osservazioni dell'agente in ogni fase della sequenza dell'agente. La traccia include il prompt completo inviato al modello di base in ogni fase e gli output del modello di base, le API risposte e le domande della Knowledge Base. È possibile utilizzare la traccia per comprendere il ragionamento dell'agente in ogni fase. Per ulteriori informazioni, consulta Tieni traccia del processo di step-by-step ragionamento dell'agente utilizzando trace
Man mano che la sessione utente con l'agente continua a ricevere più InvokeAgent
richieste, la cronologia delle conversazioni viene preservata. La cronologia delle conversazioni amplia continuamente il modello di prompt di orchestrazione di base con il contesto, contribuendo a migliorare la precisione e le prestazioni dell'agente. Il diagramma seguente mostra il processo dell'agente durante il runtime: