

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Modelli di Embedding di testo Amazon Titan
<a name="titan-embedding-models"></a>

I modelli di Embedding Amazon Titan includono Embedding di testo Amazon Titan V2 e il modello di Embedding di testo Titan G1.

**Nota**  
I modelli di incorporamento su Amazon Bedrock sono limitati dalle richieste al minuto (RPM), non dai token al minuto (TPM). Quando pianifichi la capacità o richiedi aumenti di quota per i modelli da incorporare, utilizza la quota RPM. Per ulteriori informazioni, consulta [Quote per Amazon Bedrock](quotas.md).

Gli incorporamenti di testo sono rappresentazioni vettoriali significative di testo non strutturato come documenti, paragrafi e frasi. Si inserisce un corpo del testo e l'output è un vettore (1 x n). Puoi utilizzare i vettori di incorporamento per varie applicazioni.

Il modello di Embedding di testo Amazon Titan v2 (`amazon.titan-embed-text-v2:0`) può accettare fino a 8.192 token o 50.000 caratteri o generare un vettore di dimensioni pari a 1.024. Il modello è ottimizzato per le attività di recupero del testo, ma può anche eseguire attività aggiuntive come la somiglianza semantica e il clustering.

I modelli di embedding Amazon Titan generano rappresentazioni semantiche significative di documenti, paragrafi e frasi. Embedding di testo Amazon Titan accetta come input un corpo del testo e genera un vettore (1 x n). Amazon Titan Text Embeddings viene offerto tramite invocazione degli endpoint ottimizzata per la latenza per la generazione di vettori a bassa latenza (consigliata durante la fase di recupero) e processi batch ottimizzati per la velocità di trasmissione per un'indicizzazione più rapida. Il calcolo e il recupero della somiglianza effettivi vengono eseguiti dal database vettoriale, non dal modello di incorporamento. Embedding di testo Amazon Titan v2 supporta anche documenti lunghi, tuttavia, per le attività di recupero si consiglia di segmentare i documenti in segmenti logici, come paragrafi o sezioni.

**Nota**  
Il modello di Embedding di testo Amazon Titan v2 e il modello di Embedding di testo Titan v1 non supportano parametri di inferenza come `maxTokenCount` o `topP`.

**Modello di Embedding di testo Amazon Titan V2**
+ **ID modello**: `amazon.titan-embed-text-v2:0`
+ **Numero massimo di token di testo in ingresso: 8.192**
+ **Numero massimo di caratteri di testo**: 50.000
+ **Lingue**: inglese (100 lingue aggiuntive in anteprima)
+ **Dimensione del vettore di output**: 1.024 (impostazione predefinita), 512, 256
+ **Tipi di inferenza**: on demand, velocità di trasmissione effettiva assegnata
+ **Casi d’uso supportati**: RAG, ricerca di documenti, riclassificazione, classificazione, ecc.

**Nota**  
Embedding di testo Titan V2 accetta come input una stringa non vuota con un massimo di 8.192 token o 50.000 caratteri. Il rapporto tra caratteri e token in inglese è in media di 4,7 caratteri per token. Sebbene Embedding di testo Titan V1 ed Embedding di testo V2 siano in grado di gestire fino a 8.192 token, si consiglia di segmentare i documenti in segmenti logici (come paragrafi o sezioni).

Il modello di Embedding di testo Amazon Titan v2 è ottimizzato per l’inglese, con supporto multilingue per le seguenti lingue. Le query multilingue (come fornire una base di conoscenze in coreano ed eseguire una query in tedesco) restituiranno risultati non ottimali.
+ Afrikaans
+ Albanese
+ Amarico
+ Arabo
+ Armeno
+ Assamese
+ Azero
+ Bashkir
+ Basco
+ Bielorusso
+ Bengalese
+ Bosniaco
+ Bretone
+ Bulgaro
+ Birmano
+ catalano
+ Cebuano
+ Cinese
+ Corso
+ Croato
+ Ceco
+ Danese
+ Dhivehi
+ Olandese
+ Italiano
+ Esperanto
+ Estone
+ Faroese
+ Finlandese
+ Francese
+ Galiziano
+ Georgiano
+ Tedesco
+ Gujarati
+ Haitiano
+ Hausa
+ Ebraico
+ Hindi
+ Ungherese
+ Islandese
+ Indonesiano
+ Irlandese
+ Italiano
+ Giapponese
+ Javanese
+ Kannada
+ Kazako
+ Khmer
+ Kinyarwanda
+ Kirghiso
+ Coreano
+ Curda
+ Lao
+ Latino
+ Lettone
+ Lituano
+ Lussemburghese
+ Macedone
+ Malgascio
+ Malese
+ Malese
+ Maltese
+ Maori
+ Marathi
+ Greco moderno
+ Mongolo
+ Nepalese
+ Norvegese
+ Nynorsk norvegese
+ Occitano
+ Oriya
+ Panjabi
+ Persiano
+ Polacco
+ Portoghese
+ Pushto
+ Romeno
+ Romancio
+ Russo
+ Sanscrito
+ Gaelico scozzese
+ Serbo
+ Sindhi
+ Singalese
+ Slovacco
+ Sloveno
+ Somalo
+ Spagnolo
+ Sundanese
+ Swahili
+ Svedese
+ Tagalog
+ Tagiko
+ Tamil
+ Tartaro
+ Telugu
+ Thai
+ Tibetano
+ Turco
+ Turkmeno
+ Uiguro
+ Ucraino
+ Urdu
+ Uzbeko
+ Vietnamita
+ Waray
+ Gallese
+ Frisone occidentale
+ Xhosa
+ Yiddish
+ Yoruba
+ Zulu