Modelli Amazon Titan Text Embeddings - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modelli Amazon Titan Text Embeddings

Amazon Titan I modelli di incorporamento includono Amazon Titan Text Embeddings v2 e modello Titan Text Embeddings G1.

Gli incorporamenti di testo sono rappresentazioni vettoriali significative di testo non strutturato come documenti, paragrafi e frasi. Si inserisce un corpo del testo e l'output è un vettore (1 x n). Puoi utilizzare i vettori di incorporamento per varie applicazioni.

Il modello Amazon Titan Text Embedding v2 (amazon.titan-embed-text-v2:0) può utilizzare fino a 8.192 token e generare un vettore di 1.024 dimensioni. Il modello è ottimizzato per attività di recupero del testo, ma può essere ottimizzato anche per attività aggiuntive, come la somiglianza semantica e il clustering.

I modelli Amazon Titan Embeddings generano rappresentazioni semantiche significative di documenti, paragrafi e frasi. Amazon Titan Text Embeddings prende come input un corpo di testo e genera un vettore (1 x n). Amazon Titan Text Embeddings viene offerto tramite invocazione degli endpoint ottimizzata per la latenza per una ricerca più rapida (consigliata durante la fase di recupero) e processi batch ottimizzati per la velocità effettiva per un'indicizzazione più rapida. Amazon Titan Text Embeddings v2 supporta documenti lunghi, tuttavia per le attività di recupero, si consiglia di segmentare i documenti in segmenti logici, come paragrafi o sezioni.

Nota

Il modello Amazon Titan Text Embeddings v2 e il modello Titan Text Embeddings v1 non supportano parametri di inferenza come o. maxTokenCount topP

Modello Amazon Titan Text Embeddings V2

  • ID modello: amazon.titan-embed-text-v2:0

  • Numero massimo di token di testo in ingresso: 8.192

  • Lingue: inglese (oltre 100 lingue in anteprima)

  • Dimensione del vettore di output: 1.024 (impostazione predefinita), 512, 256

  • Tipi di inferenza: on demand, velocità di trasmissione effettiva assegnata

  • Casi d'uso supportati: RAG, ricerca di documenti, riclassificazione, classificazione, ecc.

Nota

Titan Text Embeddings V2 accetta come input una stringa non vuota con un massimo di 8.192 token. Il rapporto caratteri/token in inglese è in media di 4,7 caratteri per token. Sebbene Titan Text Embeddings V1 e Titan Text Embeddings V2 siano in grado di ospitare fino a 8.192 token, si consiglia di segmentare i documenti in segmenti logici (come paragrafi o sezioni).

Il modello Amazon Titan Embedding Text v2 supporta le seguenti lingue:

  • Afrikaans

  • Albanese

  • Amarico

  • Arabo

  • Armeno

  • Assamese

  • Azero

  • Bashkir

  • Basco

  • Bielorusso

  • Bengalese

  • Bosniaco

  • bretone

  • Bulgaro

  • birmano

  • catalano

  • Cebuano

  • Cinese

  • Corso

  • Croato

  • Ceco

  • Danese

  • Dhivehi

  • Olandese

  • Italiano

  • esperanto

  • Estone

  • faroese

  • Finlandese

  • Francese

  • Galiziano

  • Georgiano

  • Tedesco

  • Gujarati

  • haitiano

  • Hausa

  • Ebraico

  • Hindi

  • Ungherese

  • Islandese

  • Indonesiano

  • irlandese

  • Italiano

  • Giapponese

  • Javanese

  • Kannada

  • Kazako

  • Khmer

  • Kinyarwanda

  • kirghiso

  • Coreano

  • curda

  • Lao

  • latino

  • Lettone

  • Lituano

  • lussemburghese

  • Macedone

  • malgascio

  • Malese

  • Malese

  • Maltese

  • Maori

  • Marathi

  • Greco moderno

  • Mongolo

  • Nepalese

  • Norvegese

  • Nynorsk norvegese

  • occitano

  • Oriya

  • Panjabi

  • Persiano

  • Polacco

  • Portoghese

  • Spingi a

  • Romeno

  • romancio

  • Russo

  • sanscrito

  • gaelico scozzese

  • Serbo

  • Sindhi

  • Singalese

  • Slovacco

  • Sloveno

  • Somalo

  • Spagnolo

  • Sundanese

  • Swahili

  • Svedese

  • Tagalog

  • Tagiko

  • Tamil

  • Tartaro

  • Telugu

  • Thai

  • tibetano

  • Turco

  • turkmeno

  • Uiguro

  • Ucraino

  • Urdu

  • Uzbeko

  • Vietnamita

  • Waray

  • Gallese

  • Frisone occidentale

  • Xhosa

  • yiddish

  • Yoruba

  • Zulu