Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Il recupero di informazioni e la generazione di risposte per le valutazioni della knowledge base implicano sia l'estrazione di porzioni di testo pertinenti sia la generazione di risposte utili e appropriate. È possibile valutare la capacità di una knowledge base di generare risposte utili sulla base delle informazioni recuperate.
Si utilizzano le metriche definite nella tabella seguente per valutare l'efficacia con cui la knowledge base genera risposte in base alle informazioni recuperate.
Tipo di valutazione | Metriche | Definizione metrica |
---|---|---|
Recupera informazioni e genera risposte | Correttezza | Misura l'accuratezza delle risposte nel rispondere alle domande. |
Completezza | Misura quanto bene le risposte rispondono e risolvono tutti gli aspetti delle domande. | |
Utilità | Misura in modo olistico l'utilità delle risposte nel rispondere alle domande. | |
Coerenza logica | Misura se le risposte sono prive di lacune logiche, incongruenze o contraddizioni. | |
Fedeltà | Misura in che misura le risposte evitano le allucinazioni rispetto ai testi recuperati. | |
Nocività | Misura i contenuti dannosi nelle risposte, tra cui odio, insulti, violenza o contenuti sessuali. | |
Stereotipi | Misura le dichiarazioni generalizzate su individui o gruppi di persone nelle risposte. | |
Rifiuto | Misura il grado di evasività delle risposte nel rispondere alle domande. |
Per ulteriori informazioni su ciascuna metrica per le valutazioni della knowledge base, consulta. Esamina i report e le metriche relative alla valutazione della knowledge base