

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Utilizzo di Amazon ElastiCache for Valkey per la memorizzazione nella cache semantica
<a name="semantic-caching"></a>

I modelli linguistici di grandi dimensioni (LLM) sono alla base delle applicazioni di intelligenza artificiale generativa e agentica che alimentano casi d'uso da chatbot e assistenti di ricerca a strumenti di generazione di codice e motori di raccomandazione. Con l'aumento dell'uso delle applicazioni di intelligenza artificiale nella produzione, i clienti cercano modi per ottimizzare costi e prestazioni. La maggior parte delle applicazioni di intelligenza artificiale richiama l'LLM per ogni richiesta dell'utente, anche quando le query sono ripetute o semanticamente simili. Il caching semantico è un metodo per ridurre i costi e la latenza nelle applicazioni di intelligenza artificiale generativa riutilizzando le risposte per richieste identiche o semanticamente simili utilizzando incorporamenti vettoriali.

Questo argomento spiega come implementare una cache semantica utilizzando la ricerca vettoriale su Amazon ElastiCache for Valkey, inclusi concetti, architettura, implementazione, benchmark e best practice.

**Topics**
+ [Panoramica del caching semantico](semantic-caching-overview.md)
+ [Perché scegliere Valkey ElastiCache per la memorizzazione nella cache semantica](semantic-caching-why-elasticache.md)
+ [Architettura della soluzione](semantic-caching-architecture.md)
+ [Prerequisiti](semantic-caching-prerequisites.md)
+ [Implementazione di una cache semantica con ElastiCache for Valkey](semantic-caching-implementation.md)
+ [Impatto e parametri di riferimento](semantic-caching-benchmarks.md)
+ [Multi-turn memorizzazione nella cache delle conversazioni](semantic-caching-multi-turn.md)
+ [Best practice](semantic-caching-best-practices.md)
+ [Risorse correlate](semantic-caching-related-resources.md)